Автор: Системный Блокъ

Скажи мне, какой у тебя индекс Хирша, и я скажу, кто ты

Разбираемся, можно ли измерить вклад учёного в науку и стоит ли это делать

Ищем смыслы: как сделать тематическое моделирование корпуса текстов

Тематическое моделирование — легкий способ понять смысловой состав большой коллекции текстов, которую невозможно быстро прочесть глазами. Пользоваться инструментами тематического моделирования может каждый — а научиться можно в нашем тьюториале. Здесь вы найдете пошаговое руководство с решением основных технических трудностей

YouTube на русском, зулусском и урду: как тестируют перевод интерфейсов

Видеохостинг YouTube имеет локализации в 100 с лишним странах — это значит, что для них есть специальная локальная версия сайта (а то и не одна). Например, когда вы заходите в YouTube из России, вы видите меню на русском языке. Такие же меню есть не только на языках-гигантах вроде английского, испанского или китайского, но и, к примеру, на суахили, эстонском, зулусском, урду, африкаансе, узбекском… А как оценивать качество перевода всех этих кнопочек в меню и их понятность для пользователей?

Я/МЫ НКРЯ: что происходит с национальным корпусом

…зачем в этом разбираться и почему мы волнуемся за НКРЯ

Машинный перевод становится синхронным

Вавилонская рыбка все ближе к вашему уху! Синхронный машинный переводчик STACL начинает выдавать перевод предложения до того, как прозвучит окончание фразы на языке оригинала. Но получится ли сравниться по качеству с человеком?

Как машинный перевод оценивает… машина?

Если качество машинного перевода проверяет человек, то это долго и дорого. А если нужно быстро и дёшево?

Кошмарные сны нейросетей

Как алгоритмы научились видеть ночные кошмары и рисовать «под Ван Гога»

Нейросеть распознала роды, саксофонистов и кенгуру в четырехмиллионом фотоархиве

Легендарный журнал LIFE пережил второе рождение в цифре. Четырехмиллионный архив фотографий теперь доступен для поиска и исследований!