BSJF - BGA Solderjoint Failure

BSJF (BGA Solderjoint Failure = BGA Lötverbindungs-Fehler) ist eine "offizielle" Bezeichnung für eine Unterbrechung an einem BGA (Ball Grid Array), zumindest war das die einzige sinnvolle Bezeichnung, die ich dazu finden konnte und dazu auch noch verhältnismäßig häufig und in vielen Bereichen. Hier zeigt sich auch schon ein Vorteil dieser Bezeichnung: Sie ist universell, nicht an ein bestimmts Gerät gebunden. Es muss nicht für jedes Gerät mit diesem Fehler ein eigener Name erfunden werden.

Randinfo für den, der es nicht weiß: Als BGA werden alle Chips bezeichnet, die keine Anschlussbeinchen an der Seite haben, sondern nur Kontaktflächen an der Unterseite, Prominentes Beispiel sind die CPU und GPU.
by Takeshi
Zwei Hauptursachen sind für die Unterbrechnungen verantwortlich:

- Durch Aufheizen und Abkühlen des Mainboards verbigt sich eben jenes. Eine Platine besteht aus mehreren Schichten Trägermaterial und Kupfer. Alle Schichten dehnen sich (unterschiedlich) mit steigender Temperatur aus, weshalb sich die Platine ähnlich einem Bimetall verbiegt. In der Regel sind Mainboards verschraubt, verbiegen sich deshalb nur sehr geringfügig. Die Bewegung ist mit dem bloßen Auge nicht zu sehen, aber dennoch vorhanden. Diese mechanische Belastung erfährt auch der BGA, weshalb die Kontakte irgendwann brechen. Jeder kennt es von Metallblechen oder Kunststoff. Verbiegt man es häufig an einer Stelle, bricht es irgendwann. Verbiegt man nicht sehr stark (aber über die Elastizität hinaus), bringt es auch, es dauert nur länger.
Dieser Prozess wird durch bleifreies Zinn wahrscheinlich noch verstärkt (ich weiß es nicht sicher), denn bleifreies Zinn ist härter als bleihaltiges. Zum Brechen der Kontakte kommt es aber in jedem Falle irgendwann, auch mit bleihaltigem Zinn.

- Liegen verschiedene Metalle aufeinander, führt das zwangsläufig zu (Kontakt-)Korrosion. Ich kenne mich damit allerdings nicht sehr gut aus, weshalb ich auch nicht abschätzen kann, wie sehr das eine Rolle im Vergleich zur mechanischen Belastung spielt.
by Takeshi
Oft ist im Zusammenhang mit einem YLOD (mit dem BSJF gemeint ist) von einem Hitzetod die Rede, was aber nicht ganz richtig ist.

Von einem Hitzetodn sprich man, wenn etwas durch eine einmalig zu hohe Temperatur - also höher als die übliche Betriebstemperatur - beschädigt wird. Das ist hier aber nicht der Fall, denn die Temperatur bewegt sich immer im zulässigen Bereich. Bei einer echten Überhitzung schaltet die Konsole auch ab. Zuvor geht der Lüfter an seine Grenzen (daran erkennt man eine Überhitzung sehr gut) und wenn es die Konsole noch schafft, zeigt sie im Bild an, dass sie zu heiß geworden ist. Davon nimmt die Konsole auch keinen Schaden, das muss schon sehr oft passieren.

Hier liegt aber, wie oben beschrieben, eine dauerhaft "zu hohe" (vom Hersteller aber so vorgesehene) Betriebstemperatur vor, durch die es zu einer hohen Temperaturschwankung (an/aus) kommt. Eine niedrigere dauerhafte Betriebstemperatur würde die Haltbarkeit der Konsole verländern, aber auch nicht bis in alle Ewigkeiten. Die Temperatur spielt also eine Rolle, doch trotzdem handelt es sich nicht um einen Hitzetod.
by Takeshi
In der PS3 ist am häufigsten die GPU (RSX) von BSJF betroffen. In den meisten Fällen bemerkt die Selbstdiagnose der Konsole die fehlerhafte Verbindung und quittiert das mit dem bekannten YLOD. Versagt allerdings die eigene Fehlerdiagnose, bleibt die Konsole an und zeigt kein Bild oder ein Bild mit Grafikfehlern und hängt sich ggf. früher oder später komplett auf. BSJF führt also nicht zwangsläufig zu einem YLOD!
by Takeshi
Zwei Verfahren werden eingesetzt, um die Verbindung wiederherzustellen. Die einfachere und kostengünstigere Variante ist ein Reflow, aufwendiger wird es beim Reballing.

Reflow: Der betroffene Chip und optimalerweise auch das Mainboard werden so weit erhitzt, bis das Lötzinn schmilzt und sich automatisch wieder verbindet. Das lässt sich ein wenig mit Eis vergleichen. Bricht Eis auseinander, kann man es an der Bruchstelle (oder komplett) auftauen und wieder einfrieren, die beiden Teile verbinden sich wieder. Wie das Wasser haftet auch Lötzinn im flüssigen Zustand an vielen Obeflächen, an einigen aber nicht. Gibt man einen Tropfen Wasser auf eine wasserabweisende Oberfläche, die eine kleine Stelle ohne wasserabweisende Oberfläche aufweist, wird sich das Wasser an dieser Stelle sammeln. So zieht es auch das Lötzinn von selbst an die Kontakte. Hinderlich kann dabei allerdings Verunreinigung sein, meistens in Form von Oxiden. Deshalb wird Flussmittel bei einem Reflow eingesetzt, das entzieht den Kontakten und dem Lötzinn den Sauerstoff und macht das Lötzinn flißender.

Reballing: Der Nachteil eines Reflows ist es, dass kein Herankommen an die Kontakte möglich ist. Manchmal kommt es vor, dass sich zwei Kontakte trotz Flussmittel nicht ordnungsgemäß verbinden, was man weder sieht, nicht behandeln kann. Deshalb wird der Chip heruntergenommen, wenn das Lötzinn flüssig ist, das Lötzinn vollständig entfernt und die Kontakte mit einem Lötkolben bearbeitet. Dabei wird auch sichtbar, wenn ein Kontakt kein Zinn annehmen will, was nun gezielt behandelt werden kann. Ist das erledigt, wird der Chip mit Lötkugeln versehen ("preballen") und wieder auf dem Mainboard aufgelötet ("reballen"). Allerdings kann es auch hierbei passieren, dass eine Verbindung nicht richtig zustande kommt!

In der Navigation findest du unterschiedlich effektive Verfahren für einen Reflow, mit steigender Nummer wird der Reflow besser, erfordert aber auch mehr Gerätschaften. Unter "Andere Tutorials" gehe ich noch auf Tutorials ein, die so im Netz herumgeistern und leider viel zu present sind.
by Takeshi
... muss der Fehler wohl wo anders liegen.

Gut möglich, dass es mit dem Reflow nicht möglich war die Verbindungen wiederherzustellen, das kommt öfter mal vor. Außerdem kann ja auch irgendein Chip auf der Platine defekt sein. Den Fehler zu finden und vorallem dann noch zu beheben ist sehr schwierig. Den Gedanken den Fehler zu finden würde ich lieber gleich verwerfen. Das kostet nur Zeit, bringt aber nicht viel, außer, du bist wirklich ein richtiger "Pro" auf dem Gebiet und hast jahrelange Erfahrung.
by Takeshi

Wirklich vorbeugen kann man BSJF (YLOD) kaum. Das Kernproblem ist die hohe Temperatur in der Konsole, doch die lässt sich nicht so leicht beeinflussen. Die Lüftersteuerung der Konsole sorgt dafür, dass eine gewisse Temperatur eingehalten wird. Steigt die Temperatur darüber, dreht der Lüfter schneller um die Temperatur wieder zu senken. Sinkt die Temperatur stark unter den Soll-Wert, dreht er wieder langsamer.
Verbessert man nun die Kühlleistung, sieht die Konsole das als Anlass den Lüfter langsamer drehen zu lassen. Die Temperatur bleibt gleich.

Zusatzlüfter bringen daher gar nichts, neue Wärmeleitpaste nicht all zu viel. Das würde ich vielleicht machen, wenn sich die Möglichkeit ergibt*. Schaden kann es nicht, die Temperatur steigt dadurch vllt auch nicht ganz so schnell an. Außerdem ist es möglich (habs noch nicht untersucht), dass die Soll-Temperatur mit jeder Lüfterstufe etwas steigt.

Das Einzige, was wirklich wirkungsvoll wäre, wäre eine andere Lüftersteuerung, die auch die Temperatur am RSX und dem Cell misst; oder eine Veränderung der bestehenden.

* Da es aber nicht viel bringt, ist davon abzuraten das einfach so zu machen, wenn es keinen triftigen Grund dafür gibt. Es kommt seltsamerweise gelegentlich zu Ausfällen durch missglückte Versuch den HS zu entfernen. Wenn die Konsole danach gar nicht mehr geht, obwohl sie vorher lief, ist damit auch nichts gewonnen.

by Takeshi
Von den bisher erhältlichen Modellen (derzeit bis v11) sind die v5 und v6 mit die besten, denn sowohl CPU als auch GPU sind in 65nm gefertigt und nicht in 90nm, wie bei den vorherigen Modellen, die Temperatur ist niedrig (um die 50°C). In der v7 hat sich an der GPU nichts geändert, wohl aber am Kühlkörper und an der Temperatur (ungefähr 60°C). Die v8 hat wiederum einen "kleineren" RSX, nun in 45nm. Bei einigen v8-Konsolen wurde dafür aber auch wieder der Kühlkörper verkleinert.

Steht der Kauf der Konsole an, ist die Sache aber schwierig, da die guten Modelle nun auch schon in die Jahre gekommen sind, die Ausfallwahrscheinlichkeit also steigt. Die neuesten Modelle sind nicht mehr so sehr BSJF-gefährdet, haben aber dafür gern andere Wehwehchen.
by Takeshi

Impressum

Powered by FrogBoard Basic v0.3.1 alpha
and FrogBoard Page v0.1.1 alpha
trisaster Dev © 2009