Фото автора

Ася Ройтберг

Автор

Лингвист по образованию, потихоньку смещаюсь в сторону data science. Много лет занимаюсь каникулярной школой в подмосковном Пущино (zips.ru). Люблю несложные походы.

Автор статей

Тест: Знаете ли вы различия между мужской и женской речью

Женщины и мужчины спорят о равенстве или превосходстве и никак не могут прийти к соглашению. Что если дело в том, что они просто говорят на разных языках? Такой вывод напрашивается после прочтения исследований о зависимости речи от гендера. По мотивам этих исследований мы создали небольшой тест, чтобы проверить, настолько ли заметна разница в коммуникации мужчин и женщин.

редакционное расстояние

Расстояние Левенштейна

Мы уже рассказывали про редакционные расстояния, с помощью которых сравнивают близость строк и вычисляют степень их похожести. Сегодня рассказываем о самом распространенном редакционном расстоянии — расстоянии Левенштейна

Что такое редакционное расстояние

Как понять, насколько близки две строки формально? Какое расстояние от слова «карета» до слова «ракета»? Линейкой здесь не измеришь, на помощь приходят редакционные расстояния. Рассказываем, что такое редакционное расстояние, как они работают и какие виды редакционных расстояний существуют

Named Entity Recognition (NER)

Когда человек читает книгу, он без труда понимает, что какие-то слова в тексте — это имя героя, а какие-то — название местности, даже если он впервые столкнулся с таким именем или названием. Для компьютера работа по распознаванию имен людей, названий организаций, топонимов и т.п. оказалась довольно сложной, но всё-таки машины с ней справляются — и с каждым годом всё лучше

Как устроен шрифт Брайля и зачем его распознавать

Брайлевский шрифт придумали для передачи военных секретов, а в итоге он пригодился незрячим. Как устроен Брайль, зачем на нем пишут «зеркально» и почему нужно научиться распознавать не только печатный, но и рукописный брайлевский текст? Отвечает Ася Ройтберг, инициатор разработки алгоритма распознавания Брайля