Статья

Название статьи МОДЕЛЬ РЕЛЕВАНТНОСТИ СЛАБОСТРУКТУРИРОВАННОЙ ИНФОРМАЦИИ В ТЕМПОРАЛЬНЫХ БАЗАХ ДАННЫХ
Автор М.А. Бутакова, С.М. Ковалев, Е.В. Климанская
Рубрика РАЗДЕЛ III. МОДЕЛИРОВАНИЕ СЛОЖНЫХ СИСТЕМ
Месяц, год 05, 2014
Индекс УДК 004.652
DOI
Аннотация Предлагается новый подход к моделированию и оценке релевантного поиска слабоструктурированной информации в темпоральных базах данных. Установлена связь между информационной слабой структурированностью данных, сохраняемых в распределенных сетевых информационных системах и информационной темпоральностью, возникающей в связи с потребностями обращения к информации, принадлежащей к определенному периоду. Рассмотрены основные модели описания слабоструктурированной информации в существующих базах данных. Представлены модели времени, на основе которых осуществляется построение темпоральных баз данных. Рассмотрены модели темпорального хранения данных, а также существующие подходы и реализация темпоральных баз данных. Представлена существующая вероятностная модель информационного ранжирования на основе многократной бернуллиевской языковой модели. Основным теоретическим результатом работы является развитие многократной бернуллиевской языковой модели для оценки информационной релевантности слабоструктурированной информации при её хранении в темпоральных базах данных.

Скачать в PDF

Ключевые слова Слабоструктурированные данные; темпоральные данные; базы данных; модель информационной релевантности.
Библиографический список 1. Luniewski A., Schwarz P., Shoens K., Stamos J., Thomas J. Information Organization using Rufus // In Proc. ACM SIGMOD Int. Conf. Of Management of Data. 1993. – P. 560-561.
2. Gaarsia-Molina H., Papakonstantiniu Y., Quass D., Rajaraman A., Sagiv Y., Ulman J., Windom J. The THIMMIS project: integration of heterogeneous information sources // J. Intell. Inf. Syst. – 1997. – Vol. 8, № 2. – P. 117-132.
3. Buneman P., Davidson S., Suciu D. Programming Constructs for Unstructured Data // In Proc. Workshop on Database Programming Languages. – 1995.
4. Редмонд Э., Уилсон Д.Р. Семь баз данных за семь недель. Введение в современные базы данных и идеологию NoSQL. – М.: ДМК Пресс, 2013. – 384 с.
5. Bubenko J.A. Jr. The temporal dimension in information modeling // Technical Report RC 6187 №26479. – IBM Thomas J Watson Research Center. – 1976.
6. Snodgrass R., Ilsoo Ahn. Temporal Databases // Computer. – 1986. – Vol. 19, № 9. – P. 35-42.
7. Snodgrass R. A taxonomy of time databases // SIGMOD’85 Proc. of the 1985 ACM SIGMOD Int. Conf. on Management of Data. – 1985. – Vol. 14, № 4. – P. 236-246.
8. Snodgrass R. The temporal query language TQuel // ACM Trans. on Database System (TODS). – 1987. – Vol. 12, № 2. – P. 247-298.
9. Snodgrass R. The TSQL2 Temporal Query Language. – Springer Science Business Media, LLC. – 1995. – 647 p.
10. Новиков Б.А. Горшкова Е.А. Темпоральные базы данных: от теории к практическому использованию // Программирование. – 2008. – Т. 34, № 1. – С. 1-6.
11. Al-Kateb M., Ghazal A., Crolotle A., Bhashyam R., Chimanchode J., Pakala S.P. Temporal query processing in Teradata // EDBT’13 Proc. of the 16h Int. Conf. on Extending Database Technology. – 2013. – P. 573-578.
12. Kulkarny K., Michels J.-E. Temporal features in SQL: 2011 // ACM SIGMOD’12. – 2012. – Vol. 41, № 3. – P. 34-43.
13. Robertson S.E. The Probability Ranking Principle in IR // Readings in information retrieval. Morgan Kaufmann Publishers Inc. – San Francisco, 1997. – P. 281-286.
14. Aurenko V., Croft W.B. Relevance-based language models // In Proceeding of SIGIR 2001. – 2001. – P. 120-127.
15. Бутакова М.А., Климанская Е.В., Янц В.И. Мера информационного подобия для анализа слабоструктурированной информации // Современные проблемы науки и образования (электронный научный журнал). – 2013. – № 6.

Comments are closed.