Методы и средства семантического анализа документов в системе делопроизводства
дипломные работы, Делопроизводство Объем работы: Год сдачи: 2015 Стоимость: 70 бел рублей (2258 рф рублей, 35 долларов) Просмотров: 287 | Не подходит работа? |
Оглавление
Введение
Заключение
Заказать работу
СОДЕРЖАНИЕ
ВВЕДЕНИЕ……………………………………………………………………….3
1. Роль семантического и лингвистического анализа текста в обработке информационных ресурсов. Алгоритмы классификации…………………….7
1.1 Семантический и лингвистический анализ текста………………………..7
1.2 Методы семантического анализа текста…………………………………20
2. Применение средств и методов семантического анализа в системе делопроизводства. Использование анализа в управлении потоком документов в системе делопроизводства……………………35
2.1 Сфера применения средств семантического анализа в системе обработки документов……………………………………………………………………….35
2.2 Использование моделей семантического анализа для оптимизации документооборота в организации……………………………………………..44
3. Оптимизация обработки документооборота средствами семантического анализа и ее экономическая эффективность………………………………….52
ЗАКЛЮЧЕНИЕ………………………………………………………………...78
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………….81
ВВЕДЕНИЕ……………………………………………………………………….3
1. Роль семантического и лингвистического анализа текста в обработке информационных ресурсов. Алгоритмы классификации…………………….7
1.1 Семантический и лингвистический анализ текста………………………..7
1.2 Методы семантического анализа текста…………………………………20
2. Применение средств и методов семантического анализа в системе делопроизводства. Использование анализа в управлении потоком документов в системе делопроизводства……………………35
2.1 Сфера применения средств семантического анализа в системе обработки документов……………………………………………………………………….35
2.2 Использование моделей семантического анализа для оптимизации документооборота в организации……………………………………………..44
3. Оптимизация обработки документооборота средствами семантического анализа и ее экономическая эффективность………………………………….52
ЗАКЛЮЧЕНИЕ………………………………………………………………...78
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ………………………….81
ВВЕДЕНИЕ
В современное время, в условиях большого информационного потока, а также постоянного расширения базы информационных ресурсов, возникает необходимость совершенствования систем обработки больших информационных потоков, их систематизации, средств накопления и поиска. В связи с чем, перед обществом стоит задача систематизации и оптимизации обработки текстовой информации по содержанию, назначению, сфере применения. В связи с этим, важное значение приобретают методы семантического анализа информации, ее систематизации. Несмотря на то, что в данной области существует множество разработок, как на отечественном, так и на зарубежном уровне, все же проблема оптимизации документооборота с использованием методов семантического анализа остается нерешенной.
Задача разработки информационных систем, таких как интеллектуальные системы документооборота или информационные порталы знаний, является одной из самых актуальных на сегодняшний день. Часто она рассматривается в контексте создания хранилищ документов и их систематизации с целью облегчения поиска необходимой информации. Несмотря на важность этих вопросов, возможностей, предоставляемых существующими информационными системами, оказывается недостаточно для интеллектуальной организации деятельности: во-первых, в постоянно разрастающемся архиве становится трудно (практически невозможно) найти нужную информацию; во-вторых, данные часто дублируются и противоречат друг другу.
Современные информационные системы должны быть способны решать весь комплекс задач, связанных с управлением потоком входящих «сырых данных» – автоматическую классификацию и автоматическое индексирование текстов, оперативное и адекватное распределение новой информации среди пользователей, передачу и хранение данных в электронном архиве и последующий поиск в нем по содержанию.
В современных условиях большого информационного потока, а также обширных объемов информационных ресурсов, главной задачей автоматической обработки документа является...
В современное время, в условиях большого информационного потока, а также постоянного расширения базы информационных ресурсов, возникает необходимость совершенствования систем обработки больших информационных потоков, их систематизации, средств накопления и поиска. В связи с чем, перед обществом стоит задача систематизации и оптимизации обработки текстовой информации по содержанию, назначению, сфере применения. В связи с этим, важное значение приобретают методы семантического анализа информации, ее систематизации. Несмотря на то, что в данной области существует множество разработок, как на отечественном, так и на зарубежном уровне, все же проблема оптимизации документооборота с использованием методов семантического анализа остается нерешенной.
Задача разработки информационных систем, таких как интеллектуальные системы документооборота или информационные порталы знаний, является одной из самых актуальных на сегодняшний день. Часто она рассматривается в контексте создания хранилищ документов и их систематизации с целью облегчения поиска необходимой информации. Несмотря на важность этих вопросов, возможностей, предоставляемых существующими информационными системами, оказывается недостаточно для интеллектуальной организации деятельности: во-первых, в постоянно разрастающемся архиве становится трудно (практически невозможно) найти нужную информацию; во-вторых, данные часто дублируются и противоречат друг другу.
Современные информационные системы должны быть способны решать весь комплекс задач, связанных с управлением потоком входящих «сырых данных» – автоматическую классификацию и автоматическое индексирование текстов, оперативное и адекватное распределение новой информации среди пользователей, передачу и хранение данных в электронном архиве и последующий поиск в нем по содержанию.
В современных условиях большого информационного потока, а также обширных объемов информационных ресурсов, главной задачей автоматической обработки документа является...
ЗАКЛЮЧЕНИЕ
В проводимом исследовании предложена понятийная модель информационной автоматизированной системы, позволяющая формализовать выполнение таких семантических операций, как поиск аналогий, обобщение и уточнение данных, рассмотрение
информации в заданном аспекте и установление логических соответствий между понятиями исходного текста. Предложенная модель служит достаточно хорошим основанием для создания
механизмов взаимопонимания различных информационных систем и инструментальных средств администратора больших баз данных.
Современные системы обработки текстовой информации, основанные на методе семантического анализа, определяя тематическую релевантность, исследуют возможности использования отношений не только между ключевыми словами, но и между объектами. Чем сильнее связь объекта с другими объектами страницы, тем более значимым становится этот объект.
Существенная часть инструментария для внутренней оптимизации до сих пор полагается на размещение ключевых слов, однако исследования показывают, что влияние этого фактора снизилось. Хотя, как правило, приходится обходиться без средств для вычисления семантических отношений и сочетаемости объектов, все же существует несколько простых способов для создания оптимизированного контента.
Как показал анализ теоретической части исследования, в системах семантической обработки текстовой информации основной задачей является формализация представления смысловой структуры текстов – выделения в них смысловых единиц и установления связей между ними. Центральной процедурой при решении этой задачи является процедура семантико-синтаксического концептуального (понятийного) анализа текстов. Важнейшим средством автоматической смысловой обработки текстовой информации являются мощные словари наименований понятий, представленные преимущественно фразеологическими словосочетаниями [3,5,6]. При анализе текстов необходимо также учитывать, что в них одни и те же объекты и процессы могут...
В проводимом исследовании предложена понятийная модель информационной автоматизированной системы, позволяющая формализовать выполнение таких семантических операций, как поиск аналогий, обобщение и уточнение данных, рассмотрение
информации в заданном аспекте и установление логических соответствий между понятиями исходного текста. Предложенная модель служит достаточно хорошим основанием для создания
механизмов взаимопонимания различных информационных систем и инструментальных средств администратора больших баз данных.
Современные системы обработки текстовой информации, основанные на методе семантического анализа, определяя тематическую релевантность, исследуют возможности использования отношений не только между ключевыми словами, но и между объектами. Чем сильнее связь объекта с другими объектами страницы, тем более значимым становится этот объект.
Существенная часть инструментария для внутренней оптимизации до сих пор полагается на размещение ключевых слов, однако исследования показывают, что влияние этого фактора снизилось. Хотя, как правило, приходится обходиться без средств для вычисления семантических отношений и сочетаемости объектов, все же существует несколько простых способов для создания оптимизированного контента.
Как показал анализ теоретической части исследования, в системах семантической обработки текстовой информации основной задачей является формализация представления смысловой структуры текстов – выделения в них смысловых единиц и установления связей между ними. Центральной процедурой при решении этой задачи является процедура семантико-синтаксического концептуального (понятийного) анализа текстов. Важнейшим средством автоматической смысловой обработки текстовой информации являются мощные словари наименований понятий, представленные преимущественно фразеологическими словосочетаниями [3,5,6]. При анализе текстов необходимо также учитывать, что в них одни и те же объекты и процессы могут...
После офорления заказа Вам будут доступны содержание, введение, список литературы*
*- если автор дал согласие и выложил это описание.