Баг чипа Atom С2XXX начнёт проявляться через 18 месяцев работы: пострадает оборудование Cisco и других компаний

alizar 8 февраля в 19:48 27,7k
В семействе процессоров Intel Atom C2000 присутствует баг, который выводит из строя устройства Cisco и других производителей (точный список продуктов известен для Cisco, но не для других компаний: проверьте, какой чип установлен в вашем оборудовании). Баг действует словно бомба замедленного действия, проявляясь не сразу, а только примерно через 1,5 года активной эксплуатации или позже.

На конференции для инвесторов по итогам IV кв. 2016 года финансовый директор Intel Роберт Свон (Robert Swan) упомянул о проблеме с одним из продуктов в IV кв. 2016 года, что повлияло на финансовые показатели. Финансист не сказал, о каком конкретно продукте говорит. Но всё тайное рано или поздно становится явным.

Роберт Свон сказал инвесторам о «проблеме с качеством», из-за которой «слегка вырос процент отказа изделия при определённых условиях и временных рамках». Для этого пришлось выделить определённый резерв, что немного повлияло на показатели (в IV кв. маржа валовой прибыли снизилась на два процентных пункта до 63%, но баг в процессорах был не единственной причиной, так что нельзя всё списывать только на него). «Мы думаем, что относительно хорошо ограничим его [ущерб] с помощью небольшого изменения в архитектуре, над которым мы работаем вместе с нашими клиентами».



Что же это за баг? Поскольку компания Intel не разглашает информацию, придётся разбираться самостоятельно, но с помощью здравого смысла и логики можно докопаться до истины.

По совпадению, буквально на прошлой неделе компания Cisco опубликовала предупреждение о проблеме с синхронизирующим сигналом (clock signal) в некоторых своих устройствах, в том числе маршрутизаторах, коммутаторах и другом оборудовании. Как стало известно, баг пристутсвует в конкретном компоненте «одного из поставщиков». В результате, в некоторых устройствах синхронизирующий сигнал затухает со временем. По оценке Cisco, все проблемные устройства должны нормально работать в первое время, но постепенно начнут выходить из строя примерно после 18 месяцев эксплуатации. Количество сбоев будет увеличиваться в зависимости от продолжительности эксплуатации. Когда этот конкретный компонент выйдет из строя, устройство перестанет функционировать, его невозможно будет ни включить, ни починить, разве что перепаять процессор.

Список устройств, которым грозит выход из строя после 18 месяцев эксплуатации:

Оптические сети FN-64230 NCS1K-CNTLR
Маршрутизаторы FN-64231 Карты NCS 5500
FN-64252 Промышленные маршрутизаторы с интегрированными сервисами IR809/IR829
FN-64253 ISR4331, ISR4321, ISR4351 и UCS-E120
Безопасность FN-64228 ASA 5506, ASA 5506W, ASA 5506H, ASA 5508 и ASA 5516
FN-64250 Cisco ISA 3000 Industrial Security Appliance
Meraki Notification MX 84
Коммутаторы FN-64251 Nexus 9000 Series N9K-C9504-FM-E/N9K-C9508-FM-E/N9K-X9732C-EX
Meraki Notification MS350 Series

Судя по популярности продуктов Cisco, пострадать может большое количество оборудования. Среди сетевиков ходит информация, что менеджеры Cisco уже обзванивают клиентов и проактивно заменяют оборудование, которое ещё пока не вышло из строя.

«Данный компонент используется также другими компаниями», — отметила Cisco в предупреждении, опять же не сообщая название компонента или компанию-поставщика.

Впрочем, о компании-поставщике уже можно было бы догадаться.

В январе 2017 года компания Intel выпустила обновленные спецификации для семейства процессоров Intel Atom C2000, в которых указала на «новую» проблему с синхронизирующим сигналом. Об этом сказано на 34-й странице обновления спецификации в примечании AVR54.



Написано, что сигналы LPC_CLKOUT0 и/или LPC_CLKOUT1 (выходные синхросигналы шины Low Pin Count) могут перестать функционировать. В этом случае устройство больше невозможно будет загрузить, поскольку без синхронизации не работает другая электроника. Указано, что для решения проблемы может быть реализовано исправление на уровне платформы.

Представитель компании Intel объяснил данную проблему как «деградацию элемента микросхемы под высокой нагрузкой после нескольких лет использования». Деградация происходит так часто, что это не соответствует стандартам качества Intel, сказал он.

Нужно заметить, что ни компания Intel, ни компания Cisco до сих пор официально не подтвердили, что проактивная замена устройств Cisco вызвана проблемой с компонентом в Atom С2000, но картина рисуется очень чёткая. Представитель Intel не согласился ни подтвердить, ни опровергнуть эту информацию.

В документации указано, что сбойным компонентом является степпинг B0 в процессорах Atom C2XX, это:

C2308, C2338, C2350, C2358, C2508, C2518, C2530, C2538, C2550, C2558, C2718, C2730, C2738, C2750 и C2758.

Они продаются с 2013 года.

На процессорах Atom C2XX работают многочисленные устройства других производителей, в том числе ASRock Rack (C2550D4I и C2750D4I), Aaeon, Dell, HP, Infortrend, iXsystems (FreeNAS Mini), Lanner, NEC, Newisys, Netgate, Netgear, Quanta, Seagate (NAS Pro), Sophos (UTM firewall SG 125), Supermicro, Synology, ZNYX Networks.

Обидно, если оборудование выйдет из строя как раз после окончания гарантийного срока, как будто это было запланировано.
Проголосовать:
+27
Сохранить: