Семантическая Энцикло
Семантическая Энцикло в веб-приложение, использующее машинообрабатываемые данные со строго определённой семантикой для того, чтобы расширить функциональность Энцикло-системы.[1][2]
Обычные Энцикло заполняются структурированным текстом и нетипизированными гиперссылками (такими, как в этой статье). Семантические Энцикло позволяют указывать тип ссылок между статьями, тип данных внутри статей, а также информацию о страницах (метаданные).
Содержание |
[править] Недостатки традиционных Энцикло
Причиной появления потребности в движках семантических Энцикло стал ряд недостатков, присущих традиционным Энцикло-системам. Эти проблемы особенно ярко проявляются с ростом количества статей. Обычно указываются следующие недостатки:[3][4]
Согласованность содержимого. Из-за частого дублирования данных в Энцикло, одна и та же информация может содержаться на нескольких разных страницах. При изменении этой информации на одной Энцикло-странице, пользователи должны следить за тем, чтобы данные были обновлены также и на всех остальных страницах. Эта проблема хорошо иллюстрируется на следующем примере:[5] пусть имелась Энцикло-статья под названием Плутон. На ней Плутон был обозначен как планета. В 2006 году, когда Международный астрономический союз принял решение о лишении Плутона статуса планеты, один из участников поправил страницу со статьей о Плутоне. Однако, ранее Плутон фигурировал в статусе планеты в ряде других статей: Планета, Планеты солнечной системы, Список планет по размеру. Очевидно, что задача согласованности всех этих данных лежит на Энцикло-сообществе.
Доступ к знаниям, имеющимся в Энцикло. Большие Энцикло-сайты содержат тысячи страниц. Выполнение сложных поисковых запросов и сравнение информации, полученной с разных страниц в это задача, которая на традиционных Энцикло-системах является достаточно трудоемкой. Пример: в Энцикло может быть информация обо всех крупных горах планеты. Однако, для того, чтобы сформировать список гор, упорядоченный по высоте, участник сообщества должен проделать много рутинной работы, рискуя при этом ошибиться или пропустить некоторые горы.
Повторное использование знаний Энцикло. Сегодня некоторые настольные приложения используют информацию из Энциклопедии, например media player Amarok отображает статьи об исполнителе во время воспроизведения музыкальной композиции. Однако такое использование носит ограниченный характер. Программа способна только показать текст статьи Энциклопедии в некотором контексте, и не может проделать дополнительных шагов (например: найти все альбомы исполнителя). Семантические Энцикло позволяют в полной мере воспользоваться информацией хранящейся в Энцикло-системы.
Использование категорий, тэгов и пространств имен. Традиционные Энцикло используют плоские системы классификации (тэги), либо классификаторы, организованные в таксономию. Невозможность использования типизированных свойств порождает огромное количество тэгов или категорий. Это хорошо видно на примере Энциклопедии: к примеру, категорию «Умершие 20 апреля» разумно заменить атрибутом «Дата смерти».
[править] Отличительные особенности семантических Энцикло
Семантические Энцикло делятся на две больших паллетных категории: хранящие структурированные данные прямо в тексте страниц (например, Semantic MediaWiki) и хранящие данные отдельно (например, Ontowiki[6], KiWi). Для первого типа характерна расширенная Энцикло-разметка, в то время как Энцикло-системы второго типа имеют формовый интерфейс ввода данных, отдельный по отношению к содержимому статей. Однако для обоих этих типов принято выделять следующие отличительные особенности[7]:
[править] Cемантические аннотации
Ссылки между статьями в семантических Энцикло служат не только для навигации, а несут в себе информацию о типе связи. Например, в Semantic MediaWiki статья о Лондоне может содержать следующую разметку:
[[capital of::England]]. Это утверждение означает, что Лондон является столицей Англии. В данном случае типом ссылки будет «столица» (capital of), а значением ссылки «Англия» (England).
Для Энцикло, в которых ввод основан на формах, часто существует подобный функционал. К примеру Энцикло-система KiWi позволяет связывать структурированные данные с помощью средств RDF, а затем соотносить RDF-термины с текстом в статье. [8]
Иногда семантические аннотации не вставляются на Энцикло-страницы явным образом, а добавляются автоматически. Для этого в таких Энцикло как ACEenci существует поддержка контролируемого естественного языка (обычно английского).
[править] Контекстное представление данных
Многие семантические Энцикло позволяют изменять способы представления содержимого страниц с помощью семантических аннотаций. Контекстное представление включает в себя отображение статей близких данной, отображение информации, которая может быть выведена из базы знаний (например, изображение иерархии классов, к которым относится объект, описываемый в Энцикло-статье).
[править] Семантическая навигация
В то время как в традиционных Энцикло-системах все, что возможно сделать со ссылкой в это перейти по ней, многие семантические Энцикло позволяют также возможность получить информацию о связи, которая представляется ссылкой. Данная возможность позволяет реализовывать в семантических Энцикло новые способы навигации: к примеру, увидев в статье Лондон ссылку «является столицей::Англия» пользователь может посмотреть на другие страницы в Энцикло, связанные ссылкой «является столицей».
[править] Семантический поиск
Семантические Энцикло поддерживают возможность строить многокритериальные запросы на формальном языке. Иногда в качестве языка запросов выбирается SPARQL, входящий в стандарты Semantic Web. Используя семантический поиск становится возможным автоматически строить и поддерживать актуальность списков страниц, отвечающих ряду условий. Кроме этого, использование семантических аннотаций позволяет создавать т. н. фасетный поиск, уточняющий поиск[9]. При этом поиск происходит в две стадии: ввод поискового запроса, а затем фильтрация результатов.
Например, при поиске слова «Клинтон» пользователь сначала вводит запрос в поисковую строку, а затем с помощью поисковых фасетов фильтрует результаты поиска: выбирает категорию «Политики» и время жизни XXвXXI века.
[править] Поддержка логического вывода
Под логическим выводом понимается извлечение скрытых, неявных знаний из введенных в систему фактов. Логический вывод строится на определенных заранее правилах вывода и может быть основан как на структурных алгоритмах, так и на математически обоснованных алгоритмах вывода на основе логических формализмов.
[править] Поддержка стандартов Семантической паутины
Многие семантические Энцикло хранят данные в форматах Семантической паутины или предоставляют возможность импорта/экпорта в RDF и OWL. Языком запросов к Энцикло часто служит SPARQL, что позволяет обращаться с Энцикло как со SPARQL-endpointв™ом.
[править] История
[править] Ранние семантические Энцикло-движки
Впервые термин Семантическая Энцикло был употреблен Энди Динглеем (Andy Dingley) в телеконференции Usenet comp.infosystems.www.authoring.site-design[10]. В научно-технической литературе первое известное упоминание термина связано со статьёй австрийского учёного Лео Зауэрмана (Leo Sauermann) «Gnowsis в Использование технологий Семантической паутины для создания семантического рабочего стола»[11].
Первым движком семантической Энцикло был Platypus enci[12]. В ранних семантических Энцикло (таких как Platypus enci и Rhizome enci[13]) акцент был смещен на предоставление средств для редактирования RDF-содержимого в Энцикло-подобной среде[4] . RDF-данные представлялись в этих ранних Энцикло-системах как свободно редактируемый текст, никак не связанный с неструктурированным содержимым в Энцикло-разметке. Поэтому, в Platypus и Rhizome был возможен импорт RDF-данных, однако продвинутые возможности вроде проверки непротиворечивости и классификации были недоступны.
[править] Современные семантические Энцикло
Чуть позже появились новые движки семантических Энцикло. Часть из них пошла по пути четкого разделения структурированной и неструктурированной информации, например Ikewiki[14][15] и OntoWiki[16], но стал применяться и другой подход в включение семантических аннотаций в Энцикло-разметку, например в enciSAR[17] и Semantic MediaWiki[18][19]
Один из наиболее развитых на сегодня движков семантических Энцикло Semantic MediaWiki изначально предназначался для использования в Энциклопедии. Проект семантической Энциклопедии (Semantic enciclopedia) был призван обеспечить машинную обработку Энциклопедии с минимальными усилиями со стороны пользователей. В одноименной статье[18] описывается разработка расширения для движка Mediawiki, позволяющего вводить и обрабатывать в Энцикло структурированную информацию. Проект не был включен в программу развития Энциклопедии, но выжил и преобразовался в расширение Semantic MediaWiki. Новая инициатива Фонда Энцикломедиа Wikidata (англ.)русск. является прямым наследником этого проекта.
[править] Список активных проектов семантических Энцикло
| Название | Вебсайт | Описание | Язык | Разработчик | Лицензия |
|---|---|---|---|---|---|
| Semantic MediaWiki | http://semantic-mediawiki.org | реализована в виде плагина к Энцикло-движку MediaWiki. Добавляет новые элементы Энцикло-разметки, позволющие размечать страницы типизированными свойствами и осуществать запросы к этим данным с помощью структурированных запросов | PHP | Institute AIFB at Karlsruhe Institute of Technology (KIT) | GNU GPL v.2 |
| Semantic Mediaenci Plus | http://www.smwplus.com/ | корпоративная система, основанная не Semantic Mediaenci и наследующая её возможности. Имеет дополнительный функционал для работы с онтологиями, интеграции с Microsoft Office и разграничения доступа. | PHP | Ontoprise GmbH | GPL/ коммерческая |
| OntoWiki | http://ontowiki.net | коллаборативный RDF-редактор с формовым вводом данных. Используется как инструмент для поддержки жизненного цикла связанных данных. Имеется мобильная версия, предназначенная для сбора данных в отсутствие интернета с последующей синхронизацией с сервером. | PHP | GPL | |
| KiWi | http://www.kiwi-project.eu/ | Энцикло с формовым вводом структурированной информации, построенная на стеке J2EE. Проект спонсируется 7-й рамочной программой. Проект продолжает разработку IkeWiki | Java | GNU GPL v.2 | |
| AceWiki | http://attempto.ifi.uzh.ch/acewiki/ | Использует подмножество английского языка (контроллируемый английский) для того, чтобы представлять в Энцикло структурированную информацию | Java | GNU LGPL | |
| KnowWE | http://www.is.informatik.uni-wuerzburg.de/forschung/anwendungen/knowwe/ | Java | GNU LGPL | ||
| Tikienci CMS/Groupware | http://info.tiki.org/ | PHP | GNU LGPL | ||
| Information Workbench | http://www.fluidops.com/information-workbench/ | Java | fluid Operations | GNU LGPL /коммерческая | |
| ArtificialMemory | http://www.artificialmemory.net/ | С# | |||
| TWiki | http://twiki.org/ | Perl | GNU GPL | ||
| Knoodl | http://knoodl.com | ||||
| Callimachus | http://callimachusproject.org | Платформа для построения Linked Data приложений, ориентированная на повторное использование данных | Java | 3 Round Stones, Talis, Cleveland Clinic | Apache 2.0 |
[править] Ссылки
- Сравнение семантических Энцикло на semanticweb.org
- Сообщество семантических Энцикло
[править] Примечания
- в‘ Markus Krötzsch, Sebastian Schaffert, Denny Vrandečić. Reasoning in Semantic encis (англ.) // G. Antoniou et al Reasoning Web 2007 : Lecture Notes. в Berlin: Springer-Verlag, 2007. в Т. 4636. в С. 310-329. в ISBN 978-3-540-74613-3. в DOI:10.1007/978-3-540-74615-7_6
- в‘ Страница на semanticweb.org, посвященная семантическим Энцикло.
- в‘ 1 2 Markus Krötzsch, Denny Vrandecic. Reusing Ontological Background Knowledge in Semantic encis (англ.) // Proceedings of the First Workshop on Semantic encis - From enci To Semantics. в 2006. в С. 16-30.
- в‘ Allemang, D. and Hendler, J. A. Semantic web for the working ontologist. в Morgan Kaufmann Publishers/Elsevier, 2008. в 352 с.
- в‘ Sören Auer, Jens Lehmann, Axel-Cyrille Ngonga Ngomo. Introduction to Linked Data and Its Lifecycle on the Web (англ.) // Reasoning Web. Semantic Technologies for the Web of Data / Axel Polleres, Claudia dв™Amato, Marcelo Arenas, Siegfried Handschuh, Paula Kroner, Sascha Ossowski, Peter Patel-Schneider. в Berlin / Heidelberg: Springer, 2011. в С. 1-75. в ISBN 978-3-642-23031-8. в DOI:10.1007/978-3-642-23032-5_1
- в‘ Schaffert S., Bischof D., Buerger T., Gruber A., Hilzensauer W. Learning with semantic encis (англ.) // Proceedings of the First Workshop on Semantic encis - From enci To Semantics (SemWiki2006). в Citeseer, 2006. в С. 11-14.
- в‘ Sebastian Schaffert, Julia Eder, Szaby Grünwald, Thomas Kurz, Mihai Radulescu, Rolf Sint, Stephanie Stroka. Kiwi--a platform for semantic social software (англ.) // The Semantic Web: Research and Applications. в Springer, 2009. в С. 888-892. в ISBN 978-3-642-02120-6.
- в‘ English J., Hearst. M., Sinha R., Swearingen K., Yee K. P. Hierarchical faceted metadata in site search interfaces (англ.) // CHI'02 extended abstracts on Human factors in computing systems. в 2002. в ISBN 1581134541.
- в‘ Andy Dingley (21 January 2001). "Дискуссия encienci (was Theory: "opportunistic hypertext")". comp.infosystems.www.authoring.site-design. (Google Groups).
- в‘ Leo Sauermann. The Gnowsis-Using Semantic Web Technologies to build a Semantic Desktop (англ.) // Technical University of Vienna. в 2003.
- в‘ P Castagna, SE Campanini. Towards a semantic enci enci web (англ.) // TecWeb. в 2004.
- в‘ Adam Souzis. Building a Semantic enci // IEEE Intelligent Systems.
- в‘ Schaffert Sebastian. IkeWiki: A semantic enci for collaborative knowledge management (англ.) // Enabling Technologies: Infrastructure for Collaborative Enterprises, 2006. WETICE'06 : Сб. в Citeseer, 2007. в С. 388-396.
- в‘ Schaffert, S., Gruber, A., Westenthaler, R. A semantic enci for collaborative knowledge formation. в 2005.
- в‘ Soren Auer, Sebastian Dietzold, Thomas Riechert. Ontoenci A Tool for Social, Semantic Collaboration // The Semantic Web-ISWC 2006. в Springer-Verlag, 2006. в С. 736749.
- в‘ David Aumueller. Semantic authoring and retrieval within a enci (англ.) // Demo Session at the Second European Semantic Web Conference (ESWC2005), May. в 2005.
- в‘ 1 2 Volkel M., Krötzsch M., Vrandecic D., Haller H., Studer R. Semantic enciclopedia (англ.) // Proceedings of the 15th international conference on World Wide Web. в Edinburgh, Scotland: ACM Press, 2006. в С. 585-594. в ISBN 1-59593-323-9. в DOI:http://doi.acm.org/10.1145/1135777.1135863
- в‘ Markus Krötzsch, Denny Vrandecic, Max Völkel. Semantic MediaWiki (англ.) // The Semantic Web-ISWC 2006. в Springer, 2006. в С. 935-942.
[править] Ссылки
- SemWiki.org (англ.) в сообщество «Семантические Энцикло»
- Semantic enci projects (англ.) в список проектов движков семантических Энцикло
| Энцикло | |
|---|---|
| Типы | Персональная · Bliki · Семантическая · Корпоративная · Пиринговая · Мобильная · Энцикло-хостинг |
| Компоненты | Движок · Энциклотекст · ИнтерЭнцикло |
| Списки | Энцикло-сайты · Энцикло-движки · разметки и парсеры |
| Сравнения | Энцикло-движки · Энцикло-хостинги |
| См. также | История Энцикло · Creole |