Исследователи из лаборатории Чанга в Калифорнийском университете Сан-Франциско разработали алгоритм машинного обучения для анализа данных нейронов. Соавтор исследования Джозеф Макин заявил The Guardian, что в будущем это может стать основой для речевого протеза. Результаты опубликовали в журнале Nature Neuroscience.
Первым этапом исследования стало «прослушивание», которое отображало нейронную активность. Джозеф Макин и Эдвард Ф. Чанг прикрепили к головам четырёх участников электроды для мониторинга судорог. Добровольцам дали 50 предложений, в которых использовалось только 250 слов. Участники должны были прочитать фразы вслух три раза. Получилось чуть меньше 40 минут материала.
В конце исследователи собрали все нейронные данные и аудиозаписи. Алгоритм должен был проанализировать и спрогнозировать сказанное при создании данных. Например, ИИ предсказал, что информация при произнесении «Маленькая птичка наблюдает за шумом» совпадает с самой фразой. В то же время предложение «Лестница использовалась для спасения кота и человека» обработалось как «Лестница будет использоваться, чтобы спасти кота и человека». Были и казусы: «Эти музыканты гармонично сочетаются» превратилось в «Шпинат был знаменитым певцом».
При этом точность определения менялась от участника к участнику. Ученые обнаружили, что алгоритм после изучения первого добровольца имеет преимущество при обработке второго. Они предполагают, что обучение ИИ может стать легче с течением времени и повторном использовании. Предсказания для одного из участников требовали коррекции в 3%. В человеческих же транскрипциях она составила 5%.
Эксперт Кристиан Херфф заявил, что новый алгоритм имеет «уровень точности, который ранее был недоступен». Исследование пока ограничено из-за небольшого количества обрабатываемых предложений и слов и других особенностей. ИИ обучали на основе произносимых вслух предложений, а не на пациентах с проблемами речи.
Исследователи говорят о множестве возможностей для улучшения алгоритма. Они ожидают, что в будущем система будет способна переводить активность мозга в текст. Это поможет улучшить жизнь немых и людей с синдромом запирания.