Нейросеть научили искать новые научные знания в миллионах статей

Исследователи из Национальной лаборатории Лоуренса, базирующейся в Беркли, совершили серьезный прорыв в создании ИИ. Они говорят, что осталось подождать чуть-чуть до того, как ИИ сможет сам совершать открытия в науке. Подкрепляют они свои утверждения новым алгоритмом, который извлекает новые, до того незамеченные людьми знания, из уже существующих научных статей.

В ходе исследования были собраны 3.3 миллиона научных работ по материаловедению. Они были опубликованы в 1000 разных журналов со всего света в период с 1922 года по 2018 год. Ученые заставили нейросеть по имени Word2vec обработать этот колоссальный массив данных. Сеть смогла распознать полмиллиона слов, каждое из которых было переведено в особый язык. Каждое слово превратили в 200 чисел, получив таким образом "тематическую" или "смысловую" координату. А потом он начал предсказывать открытия и делать их самостоятельно.

Ученые говорят, что ИИ изначально не знал о том, что такое материаловедение или даже о базовых представлениях в науке. Но благодаря тому, что он проанализировал терминологию и понятия, их употребление и соотношение друг с другом, он смог понять смысл текстов в математической форме. После этого алгоритм самостоятельно разобрался в том, что такое кристаллическая решетка и таблица Менделеева.

Затем члены группы исследователей заставили нейросеть предложить новые термоэлектрические материалы. Она сделала это с большим успехом: исследователям пришлось отобрать 10 лучших из них. Удельные свойства материалов, изобретенных ИИ, лучше, чем среднестатистические свойства в отрасли.

Более того, исследователи узнали, что алгоритм способен предугадывать научные открытия. Они ограничили доступ к научным работам до определенных годов, и прогнозы алгоритма подтвердились в реально существующих публикациях.

Ученые говорят, что Word2vec сможет значительно облегчить жизнь ученым благодаря его способности работать с громадными массивами данных. Эта часть работы является одной из самых сложных в деятельности ученых, и теперь у них появился умелы и быстрый помощник.

Отправить
Добавить

2 комментария

Wall-ery

Похоже, что человечество активно создаёт Skynet из "Терминатора". А китайцы именно так назвали свою крупнейшую в мире нейронную сеть для распознавания лиц.

Кирилл

Группа исследователей из Израильского технологического института (Технион) создала так называемую «машину Рамануджана» — устройство, которое автоматически генерирует математические гипотезы для фундаментальных констант. Статья о разработке опубликована на сайте препринтов arXiv.org.
«Машина Рамануджана» названа в честь знаменитого индийского математика Сриниваса Рамануджана — самоучки, который вырос в Индии и был обнаружен другим математиком, Годфри Харди. Он прославился тем, что вместо того, чтобы применять математические подходы для доказательств теорем, он получал результаты известных проблем благодаря интуиции, а затем другие математики находили строгие доказательства для них.

Из-за этого Рамануджана иногда называли «машиной гипотез», которая вытягивала формулы из воздуха, как будто они получены от высшего существа. В новом исследовании ученые из Израиля попытались повторить этот подход, используя компьютерную программу.
«Машина Рамануджана» является скорее концепцией, чем реальной машиной, — она существует как сеть компьютеров, работающих с алгоритмами, предназначенными для нахождения гипотез о фундаментальных константах в виде непрерывных дробей. Это доли бесконечной длины, в которых знаменатель равен сумме некоторого числа и дроби, у которой знаменатель так же представляет собой сумму числа и дроби и так далее.

Цель машины состоит в том, чтобы придумать гипотезы (в виде математических формул), которые люди могут анализировать и затем подтверждать математически. Команда, которая создала машину, надеется, что их идея вдохновит будущие поколения математиков. Ученые обещают, что любые новые алгоритмы, доказательства или гипотезы, разработанные участниками программы, будут названы в их честь. Исследователи отмечают, что их машина уже обнаружила десятки новых догадок.