1994年、4億7500万ドルの損失を引き起こしたインテルの初の大規模リコール事件「FDIVバグ」が、新たな調査でその根本原因まで追跡された。
著名なハードウェア歴史家であるケン・シリフ氏が、問題を引き起こした除算テーブルの設計ミスを特定し、当時の技術的背景と設計思想を明らかにした。このバグは、Pentiumの浮動小数点演算ユニットが持つSRT除算アルゴリズムの内部構造に起因し、欠陥トランジスタが誤った計算結果を生じさせたという。
特に注目すべきは、当時は5つとされていた欠落データポイントが、実際には16箇所も存在していた点である。このうち11箇所は偶然にも問題を引き起こさなかったが、シリフ氏の顕微鏡による調査がこれを裏付けた。リコールに至った経緯や業界への影響は、30年を経た今でも重要な教訓として語り継がれている。
ケン・シリフ氏が明らかにしたPentium FDIVバグの核心
FDIVバグの原因を追跡したケン・シリフ氏の調査は、顕微鏡を用いた精密な解析により、30年前のインテルPentiumの設計ミスを白日の下に晒した。この問題の根幹は、浮動小数点演算ユニットに搭載されたプログラム可能論理アレイ(PLA)の設計上の欠陥である。2048セルの除算テーブルにおけるトランジスタの欠落が原因で、一部の計算結果が誤るという致命的なエラーを引き起こした。
この解析で特に注目すべきは、当初「5つのデータポイントが欠けている」とされたエントリが、実際には16箇所であった点である。この差異が当時の技術的認識と現代の解析能力のギャップを示している。さらに、シリフ氏が強調したのは、欠落したエントリのうち11箇所が「運よく」エラーを引き起こさなかったという事実である。これにより、バグが発見されずに広範囲に影響を与える可能性もあった。
この分析結果は、リコールが必然であったことを物語っているが、同時に、インテルが当時のテクノロジーで問題の修正を迅速に実施した点も見逃せない。これが現在のチップ製造における品質管理の礎となったことは間違いない。
インテルのFDIVバグ対応が及ぼした業界への影響
FDIVバグによる損失額は、4億7500万ドルという当時としては巨額であったが、その影響は単なる金銭的損失にとどまらなかった。この事件は、消費者の信頼や業界全体の品質基準に多大な影響を与えた。特に、IBMがPentiumの販売を停止した判断は、インテルへの圧力を決定的なものとした。
当時の消費者や企業の反応は賛否両論であり、トーマス・ナイスリー教授のバグ発見が問題提起のきっかけとなった。一方で、インテルが誤差の発生確率を「27,000年に1度」と説明したのに対し、IBMは「24日ごと」と異なる見解を示し、議論を呼んだ。この一連の流れが、企業間競争の中で品質保証がいかに重要であるかを浮き彫りにした。
インテルは最終的に、全ての影響を受けたチップをリコールする決断を下した。この迅速な対応は、消費者保護の観点からは模範的であったが、同時にリスク管理の不備を露呈する結果にもなった。この教訓が、後のプロセッサ設計における標準化と高度なテストプロセスの導入に繋がったことは特筆すべき点である。
浮動小数点演算の進化が示す未来への指針
FDIVバグの原因であったSRT除算アルゴリズムは、当時としては画期的な設計であり、Pentiumの性能向上を支えた技術の一つである。だが、このアルゴリズムの弱点が顕在化したことで、現代の浮動小数点演算技術は大きな進化を遂げた。
現代のプロセッサには、数百億個のトランジスタが搭載されており、単一の欠陥が大規模な問題を引き起こす可能性はさらに高まっている。このため、チップ設計におけるテストやシミュレーション技術が高度化し、製造段階でのエラー検出能力が飛躍的に向上した。インテルがFDIVバグを通じて学んだ教訓は、他社を含む業界全体の進化を促したと言える。
また、消費者がハードウェアの品質に対して持つ期待値も高まり、企業は一層の透明性と信頼性を提供する責務を負うこととなった。FDIVバグが示したのは、技術革新の陰には常にリスクが潜むという事実である。そしてそのリスクにいかに対応するかが、未来の技術進化を左右する重要な要素であるといえよう。