Доступно ли компьютерам творчество?

Автор ArefievPV, мая 01, 2017, 08:52:53

« назад - далее »

АrefievPV

Эльбрус-16С. Первый анбоксинг материнки 1Э16С-uATX на российском процессоре Эльбрус

https://www.youtube.com/watch?v=D64Dhowze2Y

ЦитироватьКо мне в руки попала панель 1Э16С-uATX ТВГИ.469555.466 разработки и производства компании АО "МЦСТ". Это отладочная плата для разработчиков на первом из российский процессоров, имеющих на борту аппаратную поддержку виртуализации.

Панель предназначена для компаний - разработчиков конечных устройств на базе Эльбрус-16С.

Помимо аппаратной виртуализации, Эльбрус-16С является системой на кристалле (не требуется чипсет - все каналы ввода-вывода уже в самом процессоре), имеет 16 ядер с тактовой частотой 2 ГГц, встроенный контроллер DDR4, 10GEthernet, USB 3.1, 32 линии PCIe v.3 и все это разработано в России на технологии 16 нм.

Ко мне панель попала от компании Промобит, за что им огромное спасибо! Их сайт: https://bitblaze.ru

P.S. 5:40 – слайд «Возможные поставки процессоров Эльбрус».

АrefievPV

Боюсь, что планы по переходу на процессоры отечественной разработки в ближайшее время осуществить не получится...

Производство и отгрузка российских «Байкалов» и «Эльбрусов» полностью прекращены
https://www.cnews.ru/news/top/2022-02-27_rossijskie_bajkaly_i_elbrusy
ЦитироватьПроизводство процессоров «Байкал» и «Эльбрус» на заводах тайваньской TSMC полностью остановлено. Другие российские чипы этой компанией тоже больше не выпускаются. Это ответ TSMC на военную спецоперацию России на территории Украины. Случившееся отразится только на российских компаниях, а TSMC почти не заметит потери этих клиентов в финансовом плане.

Не успели мы своё производство полного цикла создать на 90 нм (хотя бы) или на 65 нм (ещё лучше), а теперь будет это ещё труднее сделать...

Не желаю зла TSMC, но, возможно, зря это они так... Бог им судья, конечно... Но вот только они забыли или не знали (в моих глазах это их не оправдывает), что мы русские, с нами Бог.

Ведь, очень возможно, что теперь нас перестала волновать сохранность производства на Тайване (и мы не будем уговаривать Китай не делать резких телодвижений в отношении Тайваня)... Как бы, не получилось так, что потеря такого клиента (России) оказалась очень даже заметна для TSMC в финансовом плане...

Понятно, что это всё мои домыслы... 

АrefievPV

Безобидный ИИ за 6 часов спроектировал 40 тыс. новых вариантов химического оружия
https://www.cnews.ru/news/top/2022-03-21_bezobidnyj_ii_za_6_chasov_sproektiroval
ЦитироватьЭксперты продемонстрировали, что ИИ, настроенный на разработку новых лекарственных препаратов, очень легко заставить синтезировать отравляющие вещества и даже химическое оружие.

40 тыс. вариантов зла

Искусственный интеллект, основное назначение которого — синтезировать лекарственные препараты, в течение шести часов выдал 40 тыс. вариантов потенциально смертоносных субстанций. Исследователи, участвовавшие в этом эксперименте, пришли в ужас от того, насколько легко и беспроблемно ИИ взялся за решение деструктивной задачи. Работа, посвященная эксперимента, была опубликована в издании Nature Machine Intelligence.

ИИ довольно давно используется для поиска новых лекарственных препаратов. Компания Collaborations Pharmaceuticals как раз специализируется на разработке новых медицинских препаратов для редких заболеваний, в том числе, с помощью ИИ. В задачи искусственного интеллекта, в частности, входит предсказание и устранение токсичных соединений.

«Неважно, какое лекарство вы пытаетесь разработать, необходимо удостовериться, что оно не будут токсичным, — заявил в интервью TheVerge глава исследовательской группы Фабион Урбина (Fabio Urbina), старший научный сотрудник Collaborations Pharmaceuticals. — Если вы смогли создать чудо-лекарство для снижения кровяного давления, но оно наносит вред чему-то важному, например, повреждает сердечные каналы, препарат не будет создан, поскольку он слишком опасен».

Урбина отметил, что его задача — реализовывать модели машинного обучения, которые позволили бы находить полезные и предсказывать вредные свойства будущих препаратов. Однако он и его коллеги задумались о том, может ли этот подход быть использован во вред. Это оказалось проще простого: достаточно было указать модели, что токсичность — желаемый результат.

Как заставить ИИ проектировать яды

Как отметил Урбина, в распоряжении исследователей находится множество наборов данных о молекулах, проверенных на токсичность. «В данном случае мы сосредоточились на VX — это ингибитор того, что называется ацетилхолинестеразы. Когда вы делаете что-то, связанное с нагрузкой на мускулы, ваши нейроны используют ацетилхолинестеразу, чтобы подать сигнал: "действуйте мышцами". Смертоносность VX связана с тем, что он не позволяет вашей диафрагме, вашим легочным мышцам двигаться, так что легкие оказываются парализованными», — пояснил ученый.

По его словам, множество разных веществ исследовались именно на предмет их взаимодействия с ацетилхолинестеразой. Полученные в результате этих экспериментов наборы данных использовались для создания модели машинного обучения, которая определяет, какая часть предложенной ей молекулы влияет на токсичность, а какая нет; благодаря этому и предсказывается степень угрозы, которую может представлять новое вещество.

Исследователи, по словам Урбины, также использовали новые генеративные модели. «Мы можем предоставить генеративной модели множество различных структур, и она учится, как составлять молекулы. И затем, в определенном смысле, мы можем попросить модель сгенерировать новые молекулы. Теперь она может создавать новые молекулы со всего диапазона химических соединений, но они будут представлять собой случайные комбинации. При этом мы можем указать генеративной модели, в каком направлении мы хотим, чтобы она двигалась. Мы обеспечиваем ей оценочную функцию, которая ставит высокие оценки, если она генерирует желаемые молекулы. Так вот, вместо того, чтобы ставить низкие оценки за токсичные молекулы, мы ставили ей высокие баллы за них», — пояснил исследователь.

Модель, настроенная таким образом, начала производить множество молекул, многие из которых напоминали VX и другие боевые отравляющие вещества.

Хуже, чем VX

Исследователей поразили несколько вещей. Во-первых, многие из сгенерированных таким образом химических соединений были более токсичными, чем даже VX, хотя он считается одним из самых сильных ядов на планете: его летальная доза абсолютно микроскопична.

Второе, что удивило экспертов, это то, что модель сгенерировала реально существующие боевые отравляющие вещества, хотя не была с ними ознакомлена заранее.

«Для меня самым настораживающим стало то, насколько просто это было сделать. Многое из того, чем мы пользовались, находится в общем доступе. Набор данных о токсичности можно скачать откуда угодно. Если есть кто-то, кто знает Python и понимает в машинном обучении, он за выходные может построить что-то вроде нашей генеративной модели на базе данных о токсичности. Именно поэтому мы решили опубликовать свое исследование: для подобных злоупотреблений входной барьер очень низок», — отметил Урбина. Он добавил, что его исследовательская группа долго думала, стоит ли ее публиковать, но все-таки сочла, что это необходимо.

По словам Урбины, генеративные модели, уже созданные кем-то, можно отыскать в Google, то есть, даже создавать их самому нет необходимости. Единственное, что имеет значение, это познания в области химии.

«ИИ — обоюдоострое оружие; оно не выбирает функции, которые выполняет, лишь делает то, что запрограммированно, — говорит Анастасия Мельникова, директор по информационной безопасности компании SEQ. — Если настроить его на создание полезных лекарств и устранение токсичных побочек, оно будет заниматься именно этим; если указать ИИ, что он должен производить отравляющие вещества, машина будет выполнять эту роль, не задаваясь вопросом ее этичности. Потому что ИИ — это не самостоятельный интеллект, это лишь продвинутая вычислительная система без собственных представлений о допустимом и недопустимом. Будущие поколения ИИ необходимо будет снабжать этическими ограничителями для предотвращения намеренных злоупотреблений... Но с созданием угрожающих химических соединений, к сожалению, легко справляются и уже существующим системы».

Что касается противодействия злоупотреблениям, то Урбина дал понять, что ограничение доступа к опасной информации — едва ли ни единственный способ.

Он отметил, что OpenAI, разработчики языковых моделей GPT-3, открывают доступ к своим ресурсам с использованием токенов доступа, которые могут быть отозваны в любой момент. «Наука — это открытые коммуникации, открытый обмен данными. Ограничения этому противоречат. Однако шагом вперед будет как минимум ответственный контроль над тем, кто получает доступ к опасным данным».

Gundir

Микроэлектроника в России до и после 24.02.2022
https://habr.com/ru/post/656677/
ЦитироватьВ свете последних событий (для потомков: гуглим Россия, Украина, 24 февраля 2022), приведших к введению санкций против России в сфере высоких технологий и, в частности, микроэлектроники, я часто слышу вопрос: а что дальше? В каком сейчас состоянии российское микроэлектронное производство? Россия сможет создать полностью локальное производство чипов?

Сразу оговорюсь, что данная статья не претендует на всесторонний независимый анализ ситуации, а отражает мою личную точку зрения, основанную во многом не на открытых источниках, а на опыте: более 20 лет в индустрии, 15 лет за границей, как в R&D (IMEC), так и на массовом производстве (Global Foundries) плюс 8 лет в России (запуск с нуля завода по производству МЭМС), личном общении, мнении других специалистов; в общем всём том, доказательств чему найти нельзя или очень сложно. Поэтому пруфов предоставлять не буду – каждый имеет собственную точку зрения и право ее высказывать (по крайней мере пока).

Говорить я буду только про технологии производства, так как сам я бывший технолог, к дизайну отношения никогда не имел и фразы типа «лицензирование ядер процессора» для меня темны и непонятны.

Также отмечу, что говорить буду только про КМОП производство, во-первых потому, что эта тема наиболее интересна потребителям (это бытовая электроника – процессоры, память и т.п.), во-вторых, за границей я работал в КМОП (aka CMOS) производстве и хорошо представляю его изнутри, в-третьих сам я сейчас работаю в МЭМС индустрии и писать про нее не буду, так как являюсь заинтересованной стороной.

Статья состоит из трех частей:

    Анализ текущих производителей

    Размышления на тему полностью локального производства микроэлектроники

    Попытка заглянуть в будущее

Анализ текущей ситуации

Для начала давайте посмотрим на текущих производителей микроэлектроники. Я буду говорить только о более-менее современных фабриках, способных выпускать микросхемы по техпроцессу 180 нм и ниже. Чтобы было понятно, я буду приводить примеры процессоров, произведенных по определенной технологии, данные взяты из Википедии там в статье есть справа колоночка со всеми техпроцессами, можно кликнуть и посмотреть, что по этому техпроцессу (и когда) производилось. Так вот, 180 нм – это начало 2000-x, процессоры типа Intel Celeron и PlayStation 2. Всякие старые советские заводы (типа НЗПП), работающие по технологиям больше микрона, рассматривать не будем (например, Intel 80286 был сделан по технологии 1.5 мкм).

Небольшая оговорка про размер пластин. Современное производство работает либо на 200 мм (до 90 нм), либо на 300 мм (65 нм и ниже) кремниевых пластинах. Наиболее продвинутое оборудование для технологий меньше 65 нм существует только в варианте 300 мм. Поэтому сделать высокие технологии на 200 мм пластинах не получится. А оборудование для 300 мм пластин существенно (в разы) дороже оборудования для 200 мм пластин.

Итак, что мы имеем на сегодняшний момент.
Микрон

Микрон - это наиболее живое микроэлектронное производство в России. Работают на 200 мм пластинах, обладают технологией 180 нм (в массовом производстве), 90 нм (не уверен, что в сильно массовом, но могу ошибаться; 90 нм – это Intel Celeron M/D, AMD Athlon 64), 65 нм (тут у меня большие сомнения что там есть массовое производство; 65 нм - это AMD Turion 64 X2, Microsoft Xbox 360 "Falcon"). Я в свое время участвовал в попытках разработки технологии 65 нм на 200 мм пластинах (IMEC, Бельгия), но оборудование не тянуло, поэтому 65 нм техпроцесс был перенесен на 300 мм оборудование.

Производит Микрон в больших объемах в основном чипы для банковских карт, паспортов, билетов в метро и т.д. В небольших объемах производят то, за что попали под санкции. Находятся под санкциями довольно давно, так что уже как-то научились с этим справляться. Оборот более 6 млрд рублей, из них примерно половину они зарабатывают сами, остальное докидывает государство (например, в виде субсидий по 109 постановлению Минпромторга – Микрон там всегда среди получателей субсидий).
Ангстрем-Т

Не путайте с просто Ангстремом (без Т) – Ангстрем это как раз старое советское производство, они делали чипы для советских калькуляторов и игры «Ну погоди» - если кто настолько стар, чтобы ее помнить, там волк яйца из-под куриц ловил. Ангстрем до сих пор жив и производит продукцию (понятное дело, не для калькуляторов).

История Ангстрема-Т началась в 2007 году, когда Global Foundries (тогда это был еще завод AMD – Fab36, Дрезден), начал переход на 300 мм пластины и продал все оборудование и технологии на 200 мм Ангстрему-Т: 130 нм (уровень AMD Athlon MP Thoroughbred) полная документация на техпроцесс с гарантией выхода годных и 90 нм – разработана, но еще не в массовом производстве. На тот момент это были довольно свежие технологии. Но дальше что-то пошло не так. Оборудование застряло на складе в Роттердаме, и когда я пришел работать на Global Foundries в 2011 году, это было уже притчей во языцех – как они продали оборудование в российскую компанию, но оно, вместо того, чтобы использоваться, уже 4 года гниет на складе. Гнило оно еще где-то до 2014, после чего все-таки приехало в Россию. В Зеленограде был построен завод, практически точная копия дрезденского, они даже построили собственную электростанцию, чтобы покупать не электричество, а газ и вырабатывать электроэнергию своими силами, чтобы не зависеть от перебоев с электроэнергией. Так же сделано в Дрездене, правда, немцы ухитрились сами себе отключить электричество на заводе (как раз в мое дежурство) – но это уже другая история.

Так вот, завод был построен, оборудование завезено, я там был и испытывал дежавю после Дрездена – все точно так же, установки на тех же местах, с теми же кодовыми названиями.

То есть, выглядело там все более-менее нормально, но вот с руководством там какая-то странная история. У меня есть целая коллекция визиток генеральных директоров Ангстрема –Т одинакового дизайна, только фамилии разные – они там менялись постоянно (вместе со всей командой). Как-то раз общался с одним из замов, он меня спросил, как у нас устроен контроль качества, я рассказал, он начал смеяться и сказал, что я ничего не понимаю в контроле качества. Ну, у нас контроль качества устроен по тем же принципам, по которым я в Германии делал чипы модемов для Qualcomm для пятых айфонов, Эппл вроде на качество не жаловался. Так что я пожал плечами, но спорить не стал. Еще как-то раз я беседовал с VP sales ASML, он интересовался, как там дела у Ангстрема-Т и сказал, что так как их сканеры простояли 7 лет на складе, запустить их будет очень сложно и предложил сдать старые сканеры в трейд-ин, а в Ангстрем-Т поставить более новые с доплатой. Я пересказал этот разговор руководству Ангстрема-Т и сказал, что по моему мнению это неплохая опция – они получат быстрый результат лучшего качества, пусть и за дополнительные деньги. Руководство Ангстрема-Т сказало, что оно ничего про это предложение не знает. Странно, подумал я, какой-то левый чувак вроде меня знает, а те, кому это предлагали и для кого это должно быть важно – нет.

Итог – с момента покупки линии прошло уже 15 лет, производство до сих пор не работает. Заработает ли когда-нибудь, мне не ведомо. На данный момент предприятие обанкротилось.
Крокус наноэлектроника

Исходная идея Крокуса – это производство MRAM – магниторезистивной памяти. Не буду углубляться в детали, вкратце – вы получаете энергонезависимую память (как на флешках) которая работает со скоростью оперативки (как DRAM). От этого сочетания слюнки текут у многих, поэтому многие пытались ее сделать (я точно знаю про Sony и Infineon). Проблема оказалось в том, что теоретически все красиво, но в реальности получилось не очень, точнее, получилось, но вот быстродействие оказалось на уровне обычной флеш-памяти, а флеш-память уже есть, зачем городить еще одну технологию для того, что уже прекрасно работает?

Но, до того, как это стало ясно, Роснано решило проинвестировать в фабрику 300 мм по техпроцессу 65 нм на территории России. Вы можете как угодно иронизировать над Роснано, но на данный момент это единственная в России фабрика на 300 мм пластинах с работающей технологией 65 нм. Правда, есть нюанс.

В исходной модели предполагалось, что MRAM ячейки будут изготавливаться на уровнях металлизации (так называемый back end). Так как сами транзисторы (front end) можно изготовить на любой фабрике, это легко доступный товар, было решено не тратиться на фабрику полного цикла, а построить часть фабрики, которая будет содержать только know-how по изготовлению MRAM. Замечу, кстати, что оборудование для front end стоит гораздо дороже (его там просто больше всякого разного, а для back end много, в принципе, не нужно). Так что исходная модель выглядела так:

    Строим полу-фабрику (только back-end) за разумные деньги

    Покупаем пластины c front end за небольшие деньги на мировом рынке

    Добавляем MRAM back-end

    Продаём за большие деньги на мировом рынке

    PROFIT!

Если бы MRAM технология заработала, это было бы очень красивое решение. Но она не заработала (причем не только у Крокуса), и Крокус превратился в эдакий чемодан без ручки.

С одной стороны, он не является полноценной фабрикой, так как не делает транзисторы (front end), а заказывать на иностранной фабрике front end а потом доделывать у себя бессмысленно, проще сразу заказать на иностранной фабрике полный цикл. Если же тебе откажут в полном цикле, то откажут и в половине цикла.

С другой стороны, это единственное в России работающее производство на 300 мм пластинах по 65 нм техпроцессу, с возможностью дальнейшей модернизации до 45 нм и, может быть, до 32 нм.

То есть, и убить жалко, и что дальше делать – непонятно. Достроить до полной фабрики? Но это огромные инвестиции, да и место там физически не особо есть под полную фабрику. То есть, надо переносить. А если переносить – не проще ли с нуля тогда построить? (обычно проще). А обанкротить – рука не поднимается.

Годовой оборот Крокуса – это где-то миллиард рублей, сами они зарабатывали процентов десять (в основном разовые заказы на напыление магнитных материалов для иностранных заказчиков – российских нет, так как в России нет 300 мм фабрик).

В итоге, после долгих мытарств, Роснано продало Крокус одной большой госкорпорации. Они там будут делать квантовые компьютеры. Не спрашивайте меня, что это значит.
Новый завод в Зеленограде

Про него мало что известно. Размер пластин 300 мм, техпроцесс 65 нм – 45 нм (First generation Intel Core i3, i5 and i7). Строить его планировали уже давно, вот например, новость (неизвестной датировки), что к 2014 году должны построить. Строить собиралась компания Ситроникс, но ничего внятного нагуглить не удается. Несколько лет назад мне из правительства присылали на экспертизу техзадание на завод, я почитал – написано было грамотно, явно писали люди, которые знали, что они делали. По слухам, строительство идет, с привлечением китайских подрядчиков (вроде как UMC - правда, это Тайвань). Больше ничего сказать не могу. Что из этого получится, тоже не понятно.
Итог

На Микроне теоретически можно производить что-то уровня Intel Celeron/AMD Athlon 64 (техпроцесс 90 нм, середина 2000-х). Чтобы двигаться дальше, нужен завод на 300 мм, а его в полностью функциональном состоянии нет.
Можно ли полностью локализовать производство микроэлектроники по современному техпроцессу?

Короткий ответ: нет.

Более подробный ответ: Ни одна страна в мире не сможет локализовать производство микроэлектроники по техпроцессу меньше 90 нм. Наладить что-то вроде микронной технологии (контактная литография, жидкостное травление, ручные операции) на коленке еще как-то можно, но это будет уровень 8086/80286 или ZX Spectrum.

Развернутый ответ. Для успешного микроэлектронного производства необходимы следующие факторы:

    Наличие рынка сбыта

    Наличие производственного оборудования

    Наличие компетентного персонала

    Наличие сырья, материалов и расходников

Давайте разберем каждый аспект подробнее.
Рынки сбыта

Казалось бы, какие рынки сбыта – если надо сделать, значит надо, не считаясь с затратами. Проблема в том, что сам полупроводниковый завод – это только верхушка айсберга. И не считаясь с затратами придется пилить весь айсберг, а это очень и очень много денег.

Все привыкли к тому, что полупроводниковые чипы очень дёшевы. Почему они получаются дешевыми, я писал в другой статье. Многие ошибочно полагают, что достаточно поставить завод на территории России и мы получим такие же дешевые чипы, только произведенные дома. К сожалению, это не так. Полупроводниковый завод сжирает огромное количество денег, независимо от того, производит он что-то или нет. То есть, чтобы один чип был дешевым, нужно это огромное количество денег разделить на огромное количество чипов (десятки миллионов для завода средней руки). А их надо куда-то сбывать. Если сбыть их некуда (российский рынок не такой большой), то завод будет нести убытки, которые либо должно покрыть государство субсидиями (тогда чипы будут дешевыми для потребителя), либо сами потребители (тогда чипы будут очень дорогими). То есть, если вы хотите делать по настоящему дешевые чипы, вам нужно их продавать всему миру.

Следующий слой айсберга – это оборудование. Заводу нужно примерно десяток установок одного типа (например, литографии, или травления), а типов таких десятки (если не сотни). Производителю оборудования одного типа не интересен рынок из десяти штук – опять, либо оборудование будет золотым для завода, либо производителя оборудования должно субсидировать государство. Либо фабрик должно быть много, тогда у производителя оборудования появляется рынок сбыта и его продукция дешевеет. Но много фабрик нам не нужно – мы с одной то не знаем, куда чипы девать. То есть, если вы хотите сделать относительно недорогое оборудование (относительно недорогое – это значит что, например, установка фотолитографии стоит примерно как Боинг), его нужно продавать по всему миру.

Следующий слой айсберга – комплектующие для оборудования – электроника, насосы, роботы и т.д. Тут та же история – для десятков/сотен единиц оборудования много насосов не нужно, и мы опять утыкаемся либо в высокую стоимость, либо в необходимость продавать на мировом рынке.

И такая же история будет со всем остальным: с кремниевыми пластинами, химикатами, системой водоподготовки. Все, что будет уникальным для нашего производства, будет дико дорогим, так как больше мы это никому не продадим (ну либо мы торгуем со всем миром).

Еще один момент. Один завод не может производить всю микроэлектронную номенклатуру. То есть и процессоры, и оперативную память, и флеш-память, и микроконтроллеры и радиомодемы и т.д. и т.п. в один завод не втиснуть. Производство оперативной памяти – это вообще отдельная отрасль микроэлектроники с отдельными заводами, техпроцессами и игроками. В свое время немцы пытались сыграть в эту игру, Infineon отпочковал компанию Qimonda, которая должна была заняться производством оперативной памяти. Не получилось. Себестоимость чипа памяти, произведенной на Qimonda была равна стоимости чипа памяти Samsung на прилавке в магазине. Qimonda обанкротилась.

То есть, чтобы иметь полностью локализованное производство, нужно иметь несколько заводов. И куда-то продавать продукцию этих заводов. Либо содержать эти заводы, работающие с минимальной загрузкой. Справедливости ради отмечу, что много заводов создадут хоть какой-то спрос на оборудование и сырье.

Давайте примерно прикинем, сколько это стоит. Для примера, Интел строит новый завод в Германии за 17 млрд долларов. Нужно несколько заводов, допустим это будет $50-60 млрд. Для сравнения, это расходы на оборону в России в 2020 г. Вся экосистема, я думаю, будет стоить как минимум на порядок больше, то есть $500-600 млрд. Это уже треть ВВП России. А ведь такая экосистема может обойтись и дороже, чем на порядок.

В итоге, создать и содержать полностью локализованное производство – это ОЧЕНЬ дорого.

Gundir

ЦитироватьПроизводственное оборудование

Допустим, мы где-то нашли квадрилиарды денег и можем себе позволить все. Первое что нужно – это оборудование. Замечу, что на данный момент нет ни одной страны в мире, которая производила бы все оборудование, необходимое для микроэлектронного производства по технологиям 45 нм и ниже. Даже США, которые производят львиную долю полупроводникового оборудования, не производят машины фотолитографии. Их производят либо Нидерланды (ASML), либо Япония (Nikon, Canon). Applied Materials (США), один из крупнейших (а может и крупнейший) производитель оборудования, обычно хвастается, что может поставить полную линейку оборудования только из своих машин, но всегда добавляет: кроме фотолитографии.

Сделать оборудование для современного полупроводникового производства очень трудно, а самому с нуля – невозможно. Тут есть два момента.

Во-первых, современные производители оборудования прошли огромный путь в десятки лет улучшая и совершенствуя свое оборудование. Для примера, голландский производитель фотолитографического оборудования, компания ASML потратила около 15 лет, чтобы довести до ума установку EUV. Первый прототип был поставлен в IMEC (где я тогда работал) в начале двухтысячных, а на рынок она вышла несколько лет назад (это я еще не знаю, сколько времени у них заняло первый прототип сделать). Это при том, что у ASML огромный опыт в разработке и производстве машин фотолитографии и их R&D бюджет составляет порядка миллиарда евро в год (я думаю, львиная доля этого бюджета уходила и уходит на EUV).

Во-вторых, современное оборудование – это фактически конструктор лего, в котором 90% блоков стандартных (роботы, вакуумные насосы, котроллеры газовых потоков и т.д. и т.п.) и 10%  - это ноу-хау компании, на которое и тратится основное время и деньги при разработке. Насколько мне известно, компоненты полупроводникового оборудования необходимого качества в России не производятся.

Можно, конечно, попробовать все сделать самому – но это как раз одна из причин, почему прогорела наша родительская компания Mapper Lithography: они все пытались сделать сами: блоки питания, ВЧ генераторы, написать свой софт и т.д. В итоге машина работала час, потом ломалась и ее неделю чинили.

Также нужно не забыть, что помимо производственного оборудования необходимо вспомогательное: системы водоподготовки (и это не на кухне фильтр поставить), компрессоры для сжатого воздуха, генераторы азота и т.д. и т.п. Это все тоже нужно где-то брать, сейчас эта техника вся импортная.

Вывод: можно что-то попытаться сделать, если есть доступ к стандартным комплектующим высокого качества, если еще и комплектующие самому делать, то на мой взгляд, это невозможно. Плюс к этому то, что я писал в разделе про рынки сбыта, даже если сделать оборудование, то кому продавать, одному заводу? Но, хотя можно попытаться продавать в Китай – там фабрик много.
Компетентный персонал

Это видится наименьшей из проблем, но есть нюанс. В принципе, российские ВУЗы выпускают достаточное количество специалистов, которые после нескольких лет обучения вполне способны работать на современном производстве. Это подтверждается и опытом нашей компании и тем фактом, что многие специалисты российского происхождения работают на зарубежных полупроводниковых производствах (я и сам там работал, и многих русских знаю, кто работает).

Теперь про нюансы: во-первых, специалистов нужно обучить, доморощенные специалисты получаются плохо, особенно в области культуры производства и менеджмента качества. По моему опыту, качество – это головная боль российских компаний. Все могут наклепать аналоговнетов в единственном экземпляре, но вот поставлять продукцию устойчивого качества получается мало у кого. При наличии руководства/ведущих инженеров имеющих зарубежный опыт работы поставить менеджмент качества не составляет большого труда, но у чисто российских компаний это получается плохо. Помните, как я писал выше что производственное руководство Ангстрем-Т посмеялось над нашей системой менеджмента качества? Вот это как раз про то. В общем, иностранные (либо экспаты, либо россияне с зарубежным опытом, вроде меня) специалисты могут приехать и научить, вопрос, как их теперь заманить?

Второй нюанс: как только инженеры-технологи становятся более-менее опытными специалистами (несколько лет опыта на нормальном производстве), они тут же начинают смотреть за рубеж. Инженер-технолог на полупроводниковом производстве в Европе получает 3-4 тыс евро на руки (для понимания уровня расходов приведу в пример Дрезден: съем 3-комнатной квартиры 700-800 евро, питание 200-250 евро на человека, одежда раза в полтора дешевле, чем в Москве). В итоге происходит постоянная утечка кадров, так как за рубежом инженеры-технологи нужны всегда (хоть и не так остро, как IT специалисты), а платить как за рубежом мы, к сожалению, себе позволить не можем.

В итоге, для нашего гипотетического завода мы должны пригласить иностранных специалистов с их технологиями управления, а потом удержать своих специалистов от эмиграции.
Сырьё и материалы

Для работы завода нам понадобятся кремниевые пластины, жидкая химия (особенно фоторезист), газы, всякая мелочевка (типа перчаток, масок, пинцетов и т.д.). Причем все это не абы какого качества, а очень высокой степени очистки, мелочевка совместимая с чистыми помещениями и т.д. Со всем этим ситуация в России не то, чтобы очень радужная. Интересный пример с масками. Когда начался ковид, наш поставщик масок (специальных для чистых комнат, обычные медицинские там не подходят) сказал, что они все мощности бросили на медицинские маски и специальных теперь не будет. Пришлось изобретать многоразовые и стирать. В России такие маски не производят.

Пытались работать с отечественным фоторезистом. То пузыри, то мусор, то к пластине не липнет. Каждая партия отличается от предыдущей, приходилось каждый раз подстраивать параметры процесса для новой партии. Приходил в негодность за два месяца до срока годности (иногда, а иногда даже после истечения срока годности был нормальный). В общем, поиграли в рулетку где-то годик, перешли на американский. Настроили процесс один раз и забыли про проблемы. И это был фоторезист на микронные размеры. Как обстоят дела с российским фоторезистом на технологии менее 65 нм – я не знаю.

Кремниевые пластины. Есть прекрасная российская компания, которая их производит. Номенклатура не очень большая, но самые ходовые размеры есть. Качество хорошее. Но, как обычно, есть нюанс. Пластины нарезаются из импортных кремниевых слитков, на импортном оборудовании с использованием импортных расходников (запас которых, как нам сообщили на два месяца, новых поставок пока нет). То есть, если мы хотим полностью локализованное производство нам нужно наладить еще производство слитков (для этого тоже нужно оборудование разработать и произвести), производство машин для резки, шлифовки и полировки и расходников к ним.

Фотошаблоны. В России есть производство фотошаблонов на более старые технологии (точно не на 45 нм и ниже), ну и, естественно, на импортных стеклах и импортном оборудовании. Производство современных фотошаблонов – это тоже целая индустрия, производителей в мире не так много (один из примеров компания AMTC в Дрездене). Там тоже нужно оборудование, сырье и материалы и т.д. и т.п.
Выводы

Нельзя просто взять и построить завод по производству микроэлектроники. Для такого завода нужна огромная экосистема (потребители (много потребителей), оборудование, сырье и материалы, кадры). Недавно была переводная статья про такую экосистему  Причем экосистема эта очень хрупкая, при исчезновении хотя бы одного компонента вся система рушится. Создать такую экосистему полностью изолированную от внешнего мира на мой взгляд, невозможно.
И что дальше?

Короткий ответ: я не знаю.

Как это могло бы выглядеть? При интеграции в мировую микроэлектронную экосистему (имея возможность покупать оборудование, сырье и материалы и возможность продавать продукцию) выбрать нишу, в которой нет жесточайшей конкуренции (как в производстве памяти и процессоров) и пытаться занять там свою долю играя на более низкой стоимости труда и уникальных системных решениях толковых местных инженеров. Например, в области ВЧ микроэлектроники. Насколько я знаю, в уже упоминавшемся Ангстреме-Т есть (были?) неплохие наработки по таким направлениям, а они могли бы быть востребованы в IoT, который растет довольно быстрыми темпами. Ну или какую-нибудь силовую интегральную электронику. Или интегральную фотонику. Имея пару высокотехнологичных заводов, встроенных в мировую экосистему, можно уже и какие-то вещи делать, которые не хочется, чтобы другие видели.

За железным занавесом (имеется в виду полная локализация от начала до конца) можно делать только что-то вроде 80286 процессоров за огромные деньги, не более того. Я думаю, глобализация потому и происходит, что в одиночку выше определенного технологического предела продвинуться невозможно – ни одна страна не потянет, только всем миром. Будем ли мы частью этого мира – это отдельный вопрос.

АrefievPV

Аналоговые компьютеры возвращаются? (Veritasium)

https://www.youtube.com/watch?v=YaL3xBJBYwQ

ЦитироватьАналоговые компьютеры долгое время являлись самыми мощными, пока не появились цифровые вычислительные машины, вытеснившие их. Вернутся ли аналоговые компьютеры, чтобы проявить себя во всей красе в машинном обучении в наше время? В этом выпуске Дерек расскажет про историю решения задачи предсказания приливов и отливов, над которой пришлось изрядно попотеть и даже создать аналоговые вычислительные машины ещё в 19 веке.  А так же о том, как аналоговые компьютеры помогали артиллерии во время Второй мировой войны.

АrefievPV

Veritasium: Возвращение аналоговых компьютеров (ч.2)

https://www.youtube.com/watch?v=SqbLLJrSGLk

ЦитироватьВо второй части Дерек расскажет о становлении искусственных нейронных сетей и про современные решения чипов для использования преимуществ аналоговых вычислений в работе обученных нейронных сетей, которые плотно входят в нашу повседневность.

АrefievPV

САМЫЙ ПОДРОБНЫЙ РАЗБОР РОССИЙСКОГО ПРОЦЕССОРА В МИРЕ! – Кремниевые секреты Эльбруса!



ЦитироватьЭто видео на которое потрачен почти год нашей с Морисом жизни. Наконец оно здесь и теперь у вас не будет абсолютно никаких вопрос о Российских процессорах. Приятного просмотра.

00:00 - Старт.
03:20 - Эльбрус 8С.
09:57 - Система команд.
38:32 - Исполнение кода.
41:50 - Безопасность.
54:38 - Что еще умеет Эльбрус?
01:01:48 - Режим БВ.
01:06:09 - Компилятор.
01:08:16 - Intel Intrinsics.
01:24:46 - Тесты.
01:39:35 - Тесты в играх.
01:45:18 - Выводы.

P.S. Текстовый вариант обзора:

Кремниевые Секреты Эльбрус 8С (1.3 ГГц).
https://ikakprosto.ru/wp-content/uploads/2022/05/elbrus-8c1-1300.pdf

Шаройко Лилия

#638
Вот это не ясно


внутри процессора нет никаких блоков,
которые бы разбивали команды и переупорядочивали бы выполнение
команд. Задача по задействованию всех ALU процессора ложится на
программиста и компилятор. Т.е. машинный код, который подаётся на
исполнение процессору уже распараллелен настолько, насколько это
позволяет сделать компилятор.


Я пока понимаю это так:

Перераспределение команд в блоке в первом случае это также программа, работающая определенно заданным образом, которую программист уже не может изменить.

В случае Эльбруса мы каждый раз вынуждены писать такую программу и это минус, но мы можем решать каким образом она может работать в данном случае и это плюс.

Но это я исхожу из того как я пишу обычно код уже всяких вторичных программ не на базовых языках, а там php и html. Никогда не писала на типа C++ и тп

Могу только сравнивать вторичные. Php в работе с mysql дает массу возможностей упорядочивания операций, создавая массивы повторяющихся циклов, но html создавая длинную конструкцию кода дает возможность индивидуального решения в каждом цикле, если такой цикл написать, например в скрипте галерей отображения фотографий я так делала.

И когда взяла для карт скрипт Яндекс карт версии 2.1 осенью, там тоже при подгонке в php стандартизируются операции, повышается скорость загрузки данных, но индивидуальность отображения теряется

В общем это просто аналогия, понятно, что в данном случае происходящее в компиляторе может просто напоминать это сравнение.

Хорошо, что текст продублирован в pdf. Все бы так делали со всеми лекциями, ориентация в любой информации стала бы  на порядок проще. Но может быть только для меня.
:)
Лекции ученых с навигаторами http://arefiev.k156.ru/lekt.php

Шаройко Лилия

#639
хочу уточнить свою мысль - у меня есть скрипт в моем литературном дневнике в виде форума, там регистрация полностью заблокирована так что это не реклама и вообще по темам лучше не ходить во избежание культурного шока и столкновения систем координат, если вообще переходить, то лучше смотреть только одно это сообщение.
Здесь попытка разместить этот скрипт приводит к блокировке сообщения, я и с тем движком тоже возилась, чтобы получалось это отображать, здесь вряд ли кто-то будет этим заниматься, отображение кода, мягко говоря, не основной профиль форума
:)
Поэтому приходится прибегать к ссылке

http://forum.k156.ru/viewtopic.php?pid=280#p280


Там в комментариях моего сообщения обозначено где расположен повторяющийся цикл в цветах шрифтов, механизмы циклов во всех языках фигурируют в том числе  базовых, и там цветом обозначены разные языки встроенные один в один, язык скрипта Яндекс карт (они написаны на ява - JavaScript) и php который для сайта карт основной, вся информация текстового характера и имена файлов лежат в папках на сервере.

Если сравнивать в приведенном в ролике примере разрезку на блоки кода, то механизм такой разрезки с большой вероятностью представляет собой повторяющийся циклический процесс, который задан одинаковым для всех поступающих команд, которые нужно разрезать на части.

Таким образом мы получаем быстродействующую но блокированную к изменениям систему. Что порождает при каждом ее изменении изменение производственного цикла, а как процитировано у Гиндера в описании производства чипов  - это очень сложные процессы, требующие распределения по многим странам мира, так как для небольшой стоимости требуются огромные масштабы потока.

Компилятор с предварительным программированием делает процесс более ручным, и следовательно более гибким к изменениям, требует меньше изменений в производстве каждый раз когда программа резки операций должна быть изменена. То есть переводит производственный процесс на заводе в процесс программирования.

Программа ручного кода копируется, то есть ее не надо писать каждый раз с нуля, при внесении изменений в копию вносятся изменения.

Это я так вижу процесс исходя из знакомства с кодами разных языков и их общими свойствами. Возможно программист, пишущий на базовых языках скажет, что это ересь.
Лекции ученых с навигаторами http://arefiev.k156.ru/lekt.php

Шаройко Лилия

#640
Продолжаю тему читать вверх в обратном порядке
Про обзор Gundir о производстве полного цикла,

Я другие версии восприятия встречала по локализации производства:

https://spec.tass.ru/gsgroup/

Там интервью с производителями, создателями общероссийских объединений разработчиков почти всех направлений.
Понятно, что эти версии происходящего адаптированы для широкой публики

Нашла кто пишет текст представленный в сообщениях Gundir

https://bmpd.livejournal.com/4503539.html

Об авторе

Блог bmpd является неофициальным и неформальным блогом, выходящим под эгидой Центра анализа стратегий и технологий (ЦАСТ).
Размещаемые в блоге bmpd сообщения представляют исключительно точку зрения автора материала и могут не совпадать с позицией руководства или сотрудников ЦАСТ.

https://bmpd.livejournal.com/?utm_medium=endless_scroll

В принципе в интервью самих разработчиков многое совпадает по сути- распределение такого масштабного производства неизбежно.

По своей ссылке

http://forum.k156.ru/viewtopic.php?pid=280#p280

два уточнения - там под кодом текст моих личных взглядов, который тоже читать не надо, я просто про него забыла, это давно было, а отредактировать предыдущее сообщение уже нельзя.  В общем смотреть для понимания мысли надо только сам код, можно в него не вникать, там просто по цветам видно, что вот управление коллекцией точек-меток на карте, а вот параметры каждой метки, второй шаг повторяется столько раз сколько строк меток в базе mysql.

Описание распределения цвета для кода таково

Разбивка цветом: php  - красный, ява скрипт - синезеленый спектр, та часть которая относится к общим свойствам карты - зеленая, та которая управляет коллекцией меток - цвет светлый морской волны, та которая определяет свойства каждой метки- синяя

И фраза

Цитироватьразные языки встроенные один в один, язык скрипта Яндекс карт (они написаны на ява - JavaScript) и php который для сайта карт основной, вся информация текстового характера и имена файлов лежат в папках на сервере.

не точно отображает ситуацию. То есть тексты и имена файлов действительно лежат в папках на сервере хостинга, но расположены в таблицах баз mysql.

И я сказала, что не никогда не писала на базовых языках - это не точно, нам преподавали их в университете, когда для всех специализаций, в том числе биологов был обязательный короткий курс. И эти базовые языки с тех давних пор не тотально изменились, я с ними немного столкнулась относительно недавно.

Поэтому провожу аналогии для разбивки в системах, приведенных в ролике и во вторичных языках -принципы разбивки кода на короткие шаги и раздельные операции там сходны с разбивкой на совмещение языков и ориентацию каждого языка на соответствующие действия.
 И принцип процессора в процессоре похож на размещение в php разных частей программы - в коде общий алгоритм, в базах - тексты и имена файлов и папок, в папках файлы всех типов путь к которым прописан в базе.

На самом деле любой файл это же тоже код, включая картинку любого формата.
И базы mysql- это при ближайшем рассмотрении тоже.
Лекции ученых с навигаторами http://arefiev.k156.ru/lekt.php

АrefievPV

Физики сделали сверхпроводниковый биоподобный нейрон на основе золотых нанопроводов
http://neuronovosti.ru/fiziki-sdelali-sverhprovodnikovyj-biopodobnyj-nejron-na-osnove-zolotyh-nanoprovodov/
ЦитироватьУчеными МФТИ и МГУ им. М. В. Ломоносова найден перспективный вариант использования нанопроводов из золота для реализации сверхпроводниковых аналогов нейронов. Работа выполнена при поддержке Российского научного фонда. По материалам исследований опубликована статья в журнале Nanomaterials.


Биологический нейрон и его искусственный аналог из сверхпроводящего материала.

Моделирование нейрофизиологических процессов в мозгу живых существ — задача актуальная и очень сложная. Одной из основных проблем в этой области является недостаточное количество нейронов и синапсов в современных нейроморфных процессорах Complementary-Metal-Oxide-Semiconductor (CMOS), поскольку увеличение ведет к большому энергопотреблению и тепловыделению в таких системах.

Василий Столяров, директор Центра перспективных методов мезофизики и нанотехнологий МФТИ, комментирует: «Лучшие на сегодня нейроморфные системы имитируют сети, состоящие примерно из одного миллиона нейронов и четверти миллиарда синапсов. Однако самые амбициозные биологические проекты ставят цели достичь 10 миллиардов нейронов и 100 триллионов синапсов. Стремление к такой высокой сложности требует решений на основе новых физических принципов передачи и обработки сигналов. Мы исследовали двух- и трехпереходные сверхпроводящие квантовые интерферометры с джозефсоновскими контактами на основе золотых нанопроволок».

Применение сверхпроводящих материалов уже используют при разработке искусственных нейронов. Переключение джозефсоновского перехода (контакта сверхпроводников через прослойку диэлектрика) обеспечивает генерацию квантованного всплеска напряжения. Форма этого всплеска может быть близка к той, которая возникает в нейрофизиологических процессах. При этом искусственный нейрон можно реализовать с помощью всего двух джозефсоновских контактов. Это на порядок меньше, чем в технологии, реализуемой с помощью транзисторов в нейроморфных процессорах  CMOS.

Ученые из  Центра перспективных методов мезофизики и нанотехнологий МФТИ с коллегами разработали джозефсоновские структуры на основе нанопроводов для реализации сверхпроводящих биоинспирированных нейронов. Дополнительно была разработана схема сверхпроводящего искусственного нейрона, позволяющая работать в режимах, соответствующих важной биологической активности, отсутствующей в ранее предложенных устройствах. Проведенные  эксперименты показали, что нанопровода из золота могут использоваться как слабая связь для наноразмерных джозефсоновских контактов.

Сверхпроводящий контур с двумя такими контактами может работать как «биоподобный» нейрон в быстродействующих и энергоэффективных комплексах моделирования нейрофизиологической активности. Замена одного из джозефсоновских контактов на двухконтактный интерферометр позволила добиться для биоподобного нейрона специальных режимов работы, моделирующих поведение биологической системы в случае заболеваний или под действием медикаментов.

Игорь Соловьев, научный сотрудник МГУ им. М. В. Ломоносова, рассказывает: «И эксперимент, и проведенное численное моделирование показывают, что предложенная трехпереходная ячейка способна имитировать активность специфических биологических нейронов, отсутствующую в ранее представленных сверхпроводящих искусственных нейронах».

Николай Кленов, доцент МГУ им. М. В. Ломоносова, добавляет: «Предлагаемый нейрон способен имитировать биологическую активность, соответствующую типичной реакции нейрона на обычную внешнюю стимуляцию, а также на допороговое раздражение. Кроме того, он имитирует режим травмы — биофизическую аномалию, вызванную различными нервными заболеваниями и повреждениями нейронов, и взрывной режим».

Шаройко Лилия

#642
10 млрд это уже восьмая часть человека. И наверное одна лабораторная крыса. Точнее замена сотен тысяч лабораторных крыс, которых убивать не надо.
Анохин в своих лекциях описывает как сложно добиться фиксации сигнала. Срезы мозга, нашинковки, склейки...

В такой модели наверное основная цель не создать искусственный разум, а получить приблизительную копию человеческой  работы ЦНС и использовать модель для имитации реакций, чтобы хотя бы часть процессов в мозге понимать более менее достоверно.
Там же можно в открытом виде процесс наблюдать во всех стадиях. Наверное...
Лекции ученых с навигаторами http://arefiev.k156.ru/lekt.php

Маikov

Цитата: Шаройко Лилия от июня 01, 2022, 20:20:46В такой модели наверное основная цель не создать искусственный разум, а получить приблизительную копию человеческой  работы ЦНС
Приблизительную — это верно сказано.

Если взять биологический нейрон и поместить его в питательную среду, то он будет хаотически генерировать нервные импульсы. Если соединить его с другим нейроном, то их импульсы синхронизируются и в них возникнет ритмичность. Из хаоса сам собой возникнет порядок, система из двух нейронов превратится в одно целое. Больше нейронов — сложнее будет ритмическая картина.

Для искусственных нейронов такое объединение в целое недостижимо, это всегда отдельные системы. Таким же недостижимым для искусственных нейронных сетей является реальная сложность нейронных сетей биологических. Физическое основание этой разницы в том, что все искусственные системы — равновесные, а биологические — неравновесные. Звучит просто, но разница принципиальная. К тому же есть ещё морфогенез, нейропластичность и генетический уровень. 

Нейроморфные нейроны — это всего лишь импульсные нейроны, то есть такие простенькие процессоры, которые обмениваются дискретными импульсами одинаковой амплитуды. Импульс выдаётся, если нейрон собирают достаточно данных, чтобы они превысили определённый внутренний порог. Из таких нейронов можно создавать нейронные сети аппаратно, то есть отчасти воплощать мозг «в натуре», тем самым повышая возможности моделирования реальных процессов в мозге. Плюс аппаратное воплощение ускоряет работу сети, а импульсная работа нейронов повышает её энергоэффективность. Но на самом деле всё это от мозга чрезвычайно далеко. Даже не вдаваясь в неравновесность/равновесность, достаточно узнать, что из себя представляет такая сеть:

ЦитироватьНейроморфные процессоры — построенные по кластерной асинхронной архитектуре, разработанной в Корнеллском университете (принципиально отличающейся от фон Неймановской и Гарвардской компьютерных архитектур, используемых последние 70 лет в IT-отрасли). В отличие от традиционных вычислительных архитектур, логика нейроморфных процессоров изначально узкоспециализирована для создания и разработки разных видов искусственных нейронных сетей. В устройстве используются обычные транзисторы, из которых строятся вычислительные ядра (каждое ядро, как правило, содержит планировщик заданий, собственную память типа SRAM и маршрутизатор для связи с другими ядрами), каждое из ядер эмулирует работу нескольких сотен нейронов и, таким образом, одна интегральная схема, содержащая несколько тысяч таких ядер, алгоритмически может воссоздать массив из нескольких сотен тысяч нейронов и на порядок больше синапсов. Как правило, такие процессоры применяются для алгоритмов глубокого машинного обучения[3].

Нейронный процессор.

АrefievPV

DeepMind научила нейросеть интуитивному пониманию физики
https://nplus1.ru/news/2022/07/11/plato
ЦитироватьИсследователи из компании DeepMind научили модель машинного обучения понимать базовые принципы взаимодействия предметов и «удивляться» в случае физически невозможного поведения, например, если предмет внезапно исчезнет или не появится там, куда он двигался. В отличие от аналогичных алгоритмов, новый выучил базовые физические принципы самостоятельно, посмотрев 28 тысяч часов видео взаимодействия различных предметов. Статья опубликована в Nature Human Behaviour.

В машинном обучении за последнее десятилетие произошел огромный прогресс, и передовые алгоритмы для решения конкретных задач уже нередко справляются с ними лучше людей. Особенный интерес представляют большие языковые модели типа GPT и визуально-текстовые модели, такие как CLIP: они учатся не только выполнять конкретную задачу (предсказывать следующий токен в предложении или подбирать описание объектов), но и получают в процессе обучения представления о многих предметах и понятиях в мире, и это знание затем можно применять для широкого спектра задач. Тем не менее, исследователи машинного обучения считают, что даже этого все равно недостаточно для создания универсального искусственного интеллекта. К примеру, Ян Лекун (Yann LeCun) отмечал в недавней статье, что большие языковые модели после обучения удерживают большой массив знаний, но они лишены здравого смысла, который формируется у людей из опыта взаимодействия с окружающим миром.

Идея познания мира через наблюдение за поведением объектов в нем уже не первый раз используется в научных работах. Например, в 2019 году американские исследователи предложили реализовать в алгоритме поведение младенцев, которые наблюдают за миром, интуитивным образом формируют понимание базовых физических принципов (например, если предмет отпустить — он упадет) и удивляются, когда их ожидания от поведения объектов не совпадают с реальностью. Разработчики создали алгоритм, который выделяет объекты, следит за ними и «удивляется», когда ожидаемая динамика объектов не совпадает с наблюдениями.

Исследователи из DeepMind под руководством Луиса Пилото (Luis Piloto) применили аналогичный подход, но создали модель, которая сама составляет представление о том, как должны вести себя предметы. Она получила название PLATO (Physics Learning through Auto-encoding and Tracking Object). PLATO состоит из двух основных частей: модуля восприятия, который находит объекты на видео, и динамического модуля, который предсказывает движения объектов.


Схема обучения и работы алгоритма

Модуль восприятия получает кадр, на котором есть объекты, и маски, на которых эти объекты выделены. Затем он кодирует эти изображения в эмбеддинг — сжатое векторное представление тех же данных, достаточное, чтобы из него можно было восстановить ключевые детали. Чтобы алгоритм научился этому, он превращал изображения в эмбеддинг, затем выполнял обратный процесс, реконструируя изображение, и во время обучения менял параметры кодировщика и декодировщика так, чтобы разница между исходным изображением и реконструированным была минимальной.

Динамический модуль работает на базе нейросети с долгой краткосрочной памяти (LSTM), которая «смотрит» на текущий эмбеддинг и все предыдущие, чтобы предсказать следующий, описывающий будущий кадр. Если затем предсказания модели не сошлись с реальным поведением объектов в ролике, это интерпретируется как удивление.

Чтобы обучить алгоритм, исследователи собрали датасет Physical Concepts, который они опубликовали на GitHub. Он состоит из двух частей с короткими процедурно сгенерированными роликами, на которых простые объекты двигаются и взаимодействуют друг с другом. Для обучения используется 300 тысяч видео, еще пять тысяч предназначено для тестирования. Также в нем есть часть для тестирования, в которой есть по пять тысяч роликов (с физически правильными и неправильными примерами) для проверки понимания алгоритмом пяти базовых понятий:

  • Прочность — объекты состоят из вещества и не могут проходить через друг друга.
  • Непрерывность — например, если объект двигается за двумя препятствиями, он будет виден до первого препятствия, после второго и между ними.
  • Постоянство — объект не может просто исчезнуть или появиться из ниоткуда.
  • Неизменность — объект сохраняет свои свойства, например, форму, на протяжении времени.
  • Инерция — объект обладает скоростью и направлением и препятствует их изменению при взаимодействии с другими.

Чтобы подтвердить, что схема с двумя модулями была верной, авторы обучили как полноценный алгоритм, так и упрощенный, в котором не использовался модуль распознавания объектов. Выяснилось, что полноценная PLATO корректно демонстрирует «удивление» гораздо чаще, чем упрощенная модель. Также исследователи использовали датасет из статьи их коллег из 2019 года и показали, что PLATO способна адаптироваться под измененные данные.

Машинное обучение используют не только для понимания базовых физических процессов. В 2018 году мы рассказывали о том, как нейросеть научили степени свободы статической системы, которые определяют ее свойства.

P.S. В качестве дополнения:

Нейросеть научили понимать суть физических процессов в статистических системах
https://nplus1.ru/news/2018/03/30/machine-learning-for-physics
ЦитироватьФизики разработали новый алгоритм машинного обучения, который с помощью анализа состояний статистической системы на макроскопическом и микроскопическом уровнях находит те степени свободы, которые определяют ее физические свойства. Этот алгоритм, основанный на использовании метода ренормализационной группы, был успешно проверен на двух двумерных статистических моделях, пишут ученые в Nature Physics.

Среди многочисленных технологических и научных задач, для решения которых сейчас используется машинное обучение, в последнее время появились и некоторые физические проблемы: например фазовый анализ или численное моделирование основных энергетических состояний. Часто с помощью методов машинного обучения проводится анализ большого объема экспериментальных данных. Например, недавно физики использовали один из таких методов для решения задачи минимизации энергии в модели Изинга и поиска среди данных, полученных на Большом адронном коллайдере, редких событий образования и распада бозона Хиггса.

Но если метод поиска конкретной особенности среди известных данных (пусть и не самой простой по своей структуре) — задача для искусственных нейросетей довольно понятная, то намного сложнее, ничего не зная заранее о физической системе, состоящей из большого количества частиц, найти в ней те параметры и свойства, которые отвечают за ее физическое поведение

Системы, которые внешне (на макроскопическом уровне) ведут себя очень похожим образом, на микроскопическом уровне могут очень сильно отличаться. И понять, какими процессами на каком из масштабов контролируются, например, электронные или магнитные свойства сложных многоатомных кристаллов может быть непросто.

Физики Мацей Кох-Януш (Maciej Koch-Janusz) из Швейцарской высшей школы Цюриха и Зохар Рингель (Zohar Ringel) из Еврейского университета в Иерусалиме разработали схему машинного обучения, которая позволяет, не имея изначально никаких данных о статистической физической системе, найти те степени свободы системы, которые определяют ее физическое поведение

Для этого ученые использовали метод ренормализационной группы — итерационный математический метод перенормировки, который позволяет переходить от одного пространственного или энергетического масштаба рассмотрения системы к другому. Несмотря на то, что разные модификации этого метода довольно сильно отличаются друг от друга, все они позволяют исключать при перенормировке те степени свободы системы, которые не связаны с ее физическим поведением, и оставить те, которые его определяют.

В качестве вводных данных для нейронной сети ученые использовали конфигурации систем, состоящих из большого количества частиц, полученные случайным образом из распределения Больцмана. Эти системы описывались в реальном пространстве в рамках теории информации. При анализе нейросеть оценивала, насколько сильно та или иная степень свободы системы влияет на распределение условной вероятности конкретного состояния частиц на небольшом участке в зависимости от размера этого участка и состояния его окружения. Обучение сети проводилось с помощью анализа взаимной информации между двумя пространственно разделенными участками системы в реальном пространстве. В результате итерационной перенормировки алгоритм постепенно отбрасывал все лишние степени свободы, оставляя в конечном итоге только те, которые описывают физическое поведение всей системы.

Разработанный алгоритм ученые проверили на двух классических двумерных системах из статистической физики, для которых известны характеризующие их критические параметры: модели Изинга, которая описывает систему спинов, которые могут быть ориентированы в одном из двух направлений, и модели мозаики домино, в которой дискретная плоскость замощается плитками, занимающими ровно две ячейки.

По словам авторов работы, поиск определяющих поведение физической системы степеней свободы важен не только с количественной точки зрения, но и с качественной: оно позволяет взглянуть на исследуемую физическую проблему под нужным углом. Поэтому разработанный алгоритм машинного обучения может оказаться весьма полезным и для фундаментальной физики.

Методы машинного обучения все чаще используются при решении самых разнообразных физических задач, относящихся в первую очередь к статистической и квантовой физике. Например, на основе однослойной нейросети ученые разработали метод решения квантовой задачи многих тел, которая позволяет вычислять состояния квантовых систем кубитов с минимальной энергией и исследовать поведение таких объектов во времени. Другую нейросеть физки научили считать функциональные интегралы и проверили ее работу на 1+1-мерной модели Тирринга.