wiki-linki.ru - поиск статей википедии и связей между ними

Извлечение информации


Извлечение информации (англ. information extraction) — в области обработки естественного языка, это разновидность информационного поиска, при которой из неструктурированного машинно-читаемого текста (то есть электронных документов) выделяется некая структурированная информация, то есть категоризированные, семантически значимые данные по какой-либо проблеме или вопросу. Примером извлечения информации может послужить выискивание случаев деловых визитов — формально это записывается так: НанеслиВизит(Компания-Кто, Компания-Кому, ДатаВизита), — из новостных лент, таких как: «Вчера, 1 апреля 2007 года, представители корпорации Пепелац Интернэшнл посетили офис компании Гравицап Продакшнз». Главная цель такого преобразования — возможность анализа изначально «хаотичной» информацию с помощью стандартных методов обработки данных. Более узкой целью, может служить, например, задача выявить логические закономерности в описанных в тексте событиях.


Вопрос по теме Сформулируйте свой вопрос в одном предложении. Для вопросов и ответов используется сервис Отвечай.ru

Проект wiki-linki.ru основан на данных Wikipedia, доступной в соответствии с GNU Free Documentation License.