Архивы
Первые попытки построение связного текста
Если генерировать более-менее удачные (приближенные к естественным) предложения относительно легко, то связать из них хотябы приближенно-человеческие текст – занятие не для слабонервных. Вчера весь день программил разного рода связки между предложениями, тестил… Это совсем не просто, как оказалось.
Рассуждал примерно так:
1. Текст – набор связных предложений.
2. Предложения связаны последовательно.
3. Последовательная связь выражается путем употребления [...]
читать полностью " Первые попытки построение связного текста "
Цепь Маркова четвертого порядка применительно к генерации текста
Конечно, моя увлеченность поисками идеальных алгоритмов генерации текста не могла обойти стороной теорию известного математика Маркова. Суть теории – вероятность появления некоторого события после уже известного поддается мат. оценке.
Вообще, для генерирования текстового контента их юзали еще на заре становления дорвейстроительства. С одним но. Дело в том, что реализация алгоритма хотя бы для второго порядка – [...]
читать полностью " Цепь Маркова четвертого порядка применительно к генерации текста "
О валентностях, актантах, предикатах и грамматической основе в составе предложения
Куда-то проебался предыдущий пост о семантическом парсере Тузова (с одной интересной книжкой) и приветом VitVVS. Видать, хостер накосячил. Ну и х*й с ним.
Сегодня речь пойдет о синтаксических связях в предложении.
Итак, чтобы собрать не бредоподобное (естественное) предложение надо определить синтаксические связи между семантическими категориями слов. Вдумайтесь.:) Это действительно важно, для тех, кто хочет генерить естественные тексты.
Современная [...]