Cyc
![]() | Эта статьянуждается в переработке.Пожалуйста, уточните проблему в статье с помощьюболее узкого шаблона. Пожалуйста, улучшите статью в соответствии справилами написания статей.(6 мая 2009) |
Cyc | |
---|---|
![]() | |
Тип | база знаний, машина вывода, компьютерная программа, высшая онтология, исследовательский проект[вд] и экспертная система |
Разработчики | Дуглас Ленат и Cycorp[вд] |
Написана на | Лисп, CycL[вд] и SubL[вд] |
Первый выпуск | 1984 |
Сайт | cyc.com (англ.) |
Cyc (написано латиницей, произносится Сайк) — проект по созданию объёмнойонтологическойбазы знаний, позволяющей программам решать сложные задачи из областиискусственного интеллекта на основелогического вывода и привлеченияздравого смысла.
Обзор
[править |править код]Проект началДуглас Ленат в 1984 году вMicroelectronics and Computer Technology Corporation. Название «Cyc» (образованное отангл. encyclopedia: «сайк») является зарегистрированной торговой маркой компанииCycorp, Inc вОстине, которой управляет Ленат и созданной для разработки Cyc. База знаний является собственностью компании, однако небольшая часть базы, предназначенная для установления общего словаря для программ автоматического рассуждения, была выпущена как OpenCyc подоткрытой лицензией. Позднее Cyc стала доступной для исследователей ИИ под специальной исследовательской лицензиейResearchCyc.
Типичными примерами знаний в базе являются: «Всякое дерево является растением» и «Растения смертны». Если спросить «умирают ли деревья?», машина логического вывода может сделать очевидный вывод и дать правильный ответ. База знаний (англ. Knowledge Base или KB) содержит более миллиона занесённых туда людьми утверждений, правил и общеупотребительных идей. Они формулируются на языкеCycL, который основан наисчислении предикатов и имеет схожий слиспомсинтаксис. Англоязычные пользователи шутят, что они «велосипедисты» (отангл. cyclist — велосипедист).
Большая часть сегодняшней работы в проекте Cyc всё ещё связана синженерией знаний — описание фактов об окружающем мире вручную и реализация эффективных механизмов логического вывода на основе этих знаний. Однако ведётся работа над тем, чтобы дать системе Cyc возможность самостоятельно общаться с пользователями наестественном языке, и над ускорением процессапополнения базы с помощьюмашинного обучения.
Описание базы знаний, терминология
[править |править код]Концепции в Cyc называютсяконстантами. Имена констант начинаются с необязательных символов «#$» и чувствительны к регистру.Существуют константы для:
- отдельных элементов, которые называютсяindividual, например #$BillClinton или #$France.
- совокупностей (Collections) таких, как например, #$Tree-ThePlant (в которую входят все деревья) или #$EquivalenceRelation (в которой содержатся всеотношения эквивалентности). Член совокупности называетсяэкземпляром данной коллекции.
- функций истинности (Truth Functions) которые можно применять к одной или нескольким концепциям и возвращающие значениеистина илиложь. Например, #$siblings (потомки одного родителя) является отношением родства, истинным только в том случае, когда два его аргумента являются братьями или сёстрами. По соглашению, константы функций истинности начинаются с буквы в нижнем регистре. Функции истинности поддаются разбиению на логические связки (такие как #$and, #$or, #$not, #$implies), кванторы (#$forAll, #$thereExists, и т. д.) ипредикаты.
- функцийFunctions, которые образуют новые термы из данных. Например, если передать функции #$FruitFn в качестве аргумента тип (или коллекцию) растений, она вернёт коллекцию их фруктов. По соглашению, имена констант функций начинаются с буквы в верхнем регистре и заканчиваются строкой «Fn».
Наиболее важными предикатами являются #$isa и #$genls. Первый является утверждением, что некий элемент являетсяэкземпляром некой коллекции, а второй — что коллекция является подколлекцией другой коллекции. Факты о концепциях декларируются с помощью особыхвысказываний языка CycL. Предикаты записываются в скобках перед своими аргументами:
(#$isa #$BillClinton #$UnitedStatesPresident)
означает, что «Билл Клинтон входит в совокупность президентов США», а высказывание
(#$genls #$Tree-ThePlant #$Plant)
читается как «Все деревья являются растениями».
(#$capitalCity #$France #$Paris)
значит: «Париж — столица Франции».
Высказывания также могут содержать переменные, строки начинающиеся со знака «?». Эти высказывания называются «правилами». Одно из важнейших правил, относящихся к предикату #$isa, читается:
(#$implies (#$and (#$isa ?OBJ ?SUBSET) (#$genls ?SUBSET ?SUPERSET)) (#$isa ?OBJ ?SUPERSET))
что означает «если OBJ является экземпляром коллекцииSUBSET, а SUBSET в свою очередь является подколлекцией SUPERSET, тогда OBJ также является экземпляром коллекции SUPERSET». Другой типичный пример:
(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)
что означает, что любой экземпляр коллекции #$ChordataPhylum (то есть любоехордовое) связан с самкой животного (экземпляром #$FemaleAnimal), которая является его матерью (что описывается предикатом #$BiologicalMother).
База знаний Cyc разделена намикротеории (Mt), коллекции концепций и фактов, принадлежащих одной конкретной области знаний. В отличие от полной базы знаний, всякая микротеория должна быть свободной от противоречий. Всякая микротеория имеет название, которое является обычной константой; по соглашению константы микротеорий содержат строку «Mt». Пример — #$MathMt, микротеория, содержащая математические знания. Микротеории могут наследоваться одна от другой и организованы в иерархию: одной из специализаций #$MathMt является #$GeometryGMt — микротеория о геометрии.
OpenCyc
[править |править код]Последняя версия OpenCyc, 1.0 была выпущена в июле 2006 года. OpenCyc 1.0 включает в себя полную онтологию Cyc, содержащую сотни тысяч выражений, миллионы утверждений, связывающих термы между собой. База знаний содержит 47 000 концепций и 306 000 фактов, и её можно просмотреть на сайте OpenCyc. Первая версия OpenCyc была выпущена в мае 2001 года и содержала только 6000 концепций и 60 000 фактов. База знаний выпущена под лицензиейApache.Cycorp намерена выпускать OpenCyc под параллельными, менее жёсткими лицензиями, чтобы удовлетворить потребности своих пользователей. ИнтерпретаторCycL иSubL (программа, которая позволяет просматривать и изменять базу данных и делать выводы) выпущена бесплатно, но только в двоичном виде, без исходных текстов. Она работает как подGNU/Linux, так и подMicrosoft Windows.
ResearchCyc
[править |править код]В июле 2006 года Cycorp выпустила ResearchCyc 1.0, бесплатную (но с закрытыми исходниками) версию Cyc, предназначенную для исследовательского сообщества. (ResearchCyc находился в стадии бета-версии в течение всего 2004 года, а выпущен в бета-тестирование он был в феврале 2005.) В дополнение к таксономической информации из OpenCyc, ResearchCyc включает значительно больше семантических знаний (то есть дополнительные факты) о концепциях в своей базе знаний, и включает большой лексикон, инструменты для грамматического разбора и генерациианглийского языка, написанные на языкеJava интерфейсы для редактирования знаний и создания запросов к базе.
Cycorp публично выразила своё намерение выпустить все термы и таксономические взаимосвязи, содержащиеся вResearchCyc, как часть OpenCyc, и это было сделано в версии 1.0. Одна из указанных целей — создать полностью свободный и неограниченный семантический словарь для использования всемантической паутине. Таксономия OpenCyc доступна в форматеOwl на сайте проекта OpenCyc.
Критика проекта Cyc
[править |править код]Cyc описывают как «одно из наиболее противоречивых начинаний в истории искусственного интеллекта» (Бертино и др. стр. 275), так что он неизбежно получил свою долю критики.
- Чрезмерная сложность системы — без сомнения необходимая в силу энциклопедических амбиций — и соответственно сложность добавления (вручную) данных в систему;
- Проблемы масштабируемости from widespread reification, особенно как константы;
- Неудовлетворительное использование концепции материи, и связанного с этим, различия между внутренними и внешними свойствами;
- Отсутствие вменяемых измерений производительности или сравнений эффективности машины вывода Cyc;
- Нынешняя неполнота системы как в ширину, так и глубину, и связанная с этим сложность в измерении её полноты;
- Недостаток документации;
- Отсутствие неустаревшего онлайнового обучающего материала усложняет изучение системы для новичков;
- Несмотря на своё название система OpenCyc не является полностью открытой: данные доступны для редактирования пользователям, но код недоступен для расширения разработчикам.[1]
Данные вопросы обсуждались в разных местах с момента запуска проекта. Даг Ленат и другие опубликовали множество аргументов в защиту своего проекта.
См. также
[править |править код]Библиография
[править |править код]В статье есть списокисточников, ноне хватаетсносок. Без сносок сложноопределить, из какого источника взято каждое отдельное утверждение. Вы можете улучшить статью, проставивсноски на источники, подтверждающие информацию. Сведения без сносокмогут быть удалены.(14 февраля 2021) |
- Elisa Bertino, Gian Piero Zarri, Barbara Catania, Gian Pierro Zarri. Intelligent Database Systems (неопр.). —Addison-Wesley Professional, 2001.
- Matuszek, Cynthia,M. Witbrock, R. Kahlert, J. Cabral, D. Schneider, P. Shah andD. Lenat.Searching for Common Sense: Populating Cyc from the Web. In Proceedings of the Twentieth National Conference on Artificial Intelligence, Pittsburgh, Pennsylvania, July 2005.[1]
- Shepard, Blake, C. Matuszek, C.B. Fraser, W. Wechtenhiser, D. Crabbe, Z. Gungordu, J. Jantos, T. Hughes, L. Lefkowitz, M. Witbrock, D. Lenat, E. Larson.A Knowledge-Based Approach to Network Security: Applying Cyc in the Domain of Network Risk Assessment. In Proceedings of the Seventeenth Innovative Applications of Artificial Intelligence Conference, Pittsburgh, Pennsylvania, July 2005.[2]
- Ramachandran, Deepak, P. Reagan, K. Goolsbey.First-Orderized ResearchCyc: Expressivity and Efficiency in a Common-Sense Ontology. In Papers from the AAAI Workshop on Contexts and Ontologies: Theory, Practice and Applications. Pittsburgh, Pennsylvania, July 2005.[3]
- Cabral, John, R.C. Kahlert, C. Matuszek, M. Witbrock, B. Summers.Converting Semantic Meta-Knowledge into Inductive Bias. In Proceedings of the 15th International Conference on Inductive Logic Programming, Bonn, Germany, August 2005.[4]
- Schneider, Dave, C. Matuszek, P. Shah, R. Kahlert, D. Baxter, J. Cabral, M. Witbrock, D. Lenat.Gathering and Managing Facts for Intelligence Analysis. In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, May 2005.[5]
- Forbus, Kenneth, L. Birnbaum, E. Wagner, J. Baker &M. Witbrock.Combining analogy, intelligent information retrieval, and knowledge integration for analysis: A preliminary report. In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, May 2005.[6]
- Deaton, Chris, B. Shepard, C. Klein, C. Mayans, B. Summers, A. Brusseau,M. Witbrock. The Comprehensive Terrorism Knowledge Base in Cyc. In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, May 2005.[7]
- Rode, Benjamin.Towards a Model of Pattern Recovery in Relational Data. In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, May 2005.[8]
- Siegel, Nick, B. Shepard, J. Cabral, M. Witbrock.Hypothesis Generation and Evidence Assembly for Intelligence Analysis: Cycorp’s Nooscape Application. In Proceedings of the 2005 International Conference on Intelligence Analysis, McLean, Virginia, May 2005.[9]
- Curtis, Jon, G. Matthews, D. Baxter. On the Effective Use of Cyc in a Question Answering System in Papers from the IJCAI Workshop on Knowledge and Reasoning for Answering Questions, Edinburgh, Scotland: 2005.[10]
- Witbrock, Michael, C. Matuszek, A. Brusseau, R.C. Kahlert, C.B. Fraser, D. Lenat.Knowledge Begets Knowledge: Steps towards Assisted Knowledge Acquisition in Cyc in Papers from the 2005 AAAI Spring Symposium on Knowledge Collection from Volunteer Contributors (KCVC), pp. 99–105. Stanford, California, March 2005.[11]
- Belasco, Alan, J. Curtis, RC Kahlert, C. Klein, C. Mayans, R. Reagan.Representing Knowledge Gaps Effectively. In D. Karagiannis, U. Reimer (Eds.): Practical Aspects of Knowledge Management, Proceedings of PAKM 2004, Vienna, Austria, December 2-3, 2004, Springer-Verlag, Berlin Heidelberg.[12]
- Siegel, Nick, G. Matthews, J. Masters, R. Kahlert, M. Witbrock and K. Pittman.Agent Architectures: Combining the Strengths of Software Engineering and Cognitive Systems in Papers from the AAAI Workshop on Intelligent Agent Architectures: Combining the Strengths of Software Engineering and Cognitive Systems, Technical Report WS-04-07, pp. 74–79. Menlo Park, California: AAAI Press, 2004.[13]
- Witbrock, Michael, K. Panton, S.L. Reed, D. Schneider, B. Aldag, M. Reimers and S. Bertolo.Automated OWL Annotation Assisted by a Large Knowledge Base in Workshop Notes of the 2004 Workshop on Knowledge Markup and Semantic Annotation at the 3rd International Semantic Web Conference ISWC2004, Hiroshima, Japan, November 2004, pp. 71–80.[14]
- Masters, James and Z. Gungordu.Structured Knowledge Source Integration: A Progress Report. In Integration of Knowledge Intensive Multiagent Systems, Cambridge, Massachusetts, USA, 2003.[15]
- O’Hara, Tom, N. Salay, M. Witbrock, et al.Inducing criteria for mass noun lexical mappings using the Cyc Knowledge Base and its Extension to WordNet. In Proceedings of the Fifth International Workshop on Computational Semantics, Tilburg, 2003.[16]
- Witbrock, Michael, D. Baxter, J. Curtis, et al.An Interactive Dialogue System for Knowledge Acquisition in Cyc. In Proceedings of the Eighteenth International Joint Conference on Artificial Intelligence, Acapulco, Mexico, 2003.[17]
- Panton, Kathy, P. Miraglia, N. Salay, et al.Knowledge Formation and Dialogue Using the KRAKEN Toolset. In Eighteenth National Conference on Artificial Intelligence, Edmonton, Canada, 2002.[18]
- Masters, James.Structured Knowledge Source Integration and its applications to information fusion. In Proceedings of the Fifth International Conference on Information Fusion, Annapolis, MD, July 2002.[19]
- Reed, Stephen and D. Lenat.Mapping Ontologies into Cyc. In AAAI 2002 Conference Workshop on Ontologies For The Semantic Web, Edmonton, Canada, July 2002.[20]
- D. Lenat and R. V. Guha. Building Large Knowledge-Based Systems: Representation and Inference in the Cyc Project (англ.). —Addison-Wesley, 1990.
- Вымышленнаядумающая машинаSAL 9000 явно обращается к энциклопедической базе чтобы понять почему её создатель использовал название «Phoenix» для диагностической симуляции которая помогла бы снова запустить её устройство-близнеца,HAL 9000, в саге2001.
- Вымышленнаядумающая машинаKARR (Knight Rider) явно обращается к базе данных во время проверки основных человеческих желаний (эпизод «Trust doesn’t rust»).
Примечания
[править |править код]- ↑Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R.Semantic WikipediaАрхивная копия от 31 декабря 2019 наWayback Machine. In Proceedings of the 15th International Conference on World Wide Web. WWW '06. ACM Press, New York, NY. Edinburgh, Scotland, May 23 — 26, 2006. — pp. 585—594
Ссылки
[править |править код]- cyc.com (англ.) — официальный сайт Cyc
- Публикации, доступные на сайте Cycorp (недоступная ссылка —история)
- Opencyc.org (включает несколько статей для новичков)
- research.cyc.com
- The Cyc Foundation
- Список серверов, которые позволяют просматривать содержимое базы знаний OpenCyc
- sourceforge.net/projects/opencyc,открытая версия верхней онтологии Cyc (версия 1.0 была создана14 июля,2006)
- OpenCyc C API
- Здравый смысл15 апреля2006, New Scientist
- «Признания циклиста» — Блог о Cyc
- Дискуссия о Cyc в Фидо-эхе SU.FORTH, октябрь-декабрь 2007: googlegroups/fido-online (недоступная ссылка)
- Википедия:Статьи к переработке с мая 2009 года
- Википедия:Статьи к переработке
- Википедия:Статьи с шаблонами недостатков по алфавиту
- Википедия:Статьи со ссылками на элементы Викиданных без русской подписи
- Википедия:Статьи с изображениями: заполнить свойство P18 в Викиданных
- Википедия:Статьи с изображениями: заполнить свойство P373 в Викиданных
- ПРО:ИТ:Статьи по алфавиту
- ПРО:ИТ:Последняя правка: в текущем году
- Википедия:Статьи без сносок с февраля 2021 года
- Википедия:Статьи без сносок
- Википедия:Статьи с некорректным использованием шаблонов:Книга (указан неверный код языка)
- Википедия:Статьи с нерабочими ссылками