日本語Wikipediaオントロジー

応募者の情報
ご氏名 玉川奨,香川宏介,森田武史,山口高平
ご所属 慶應義塾大学山口研究室
e-mailアドレス s_tamagawa [at] ae.keio.ac.jp
応募するデータセットの情報
データセットの名称 日本語Wikipediaオントロジー
データセットのURL http://www.wikipediaontology.org
データセットの概略説明 Wikipediaは語彙網羅性および即時更新性に優れており,半構造情報資源であることからオントロジー構築のための情報資源として非常に優れています.DBpediaもWikipediaのInfoboxと呼ばれる構造からLODを構築していますが,Infoboxは記事全体の3分の1程度しか存在していません.私たちはこれまで,日本語版Wikipediaの様々な構造を利用し,日本語に特化した大規模で汎用的なオントロジーを構築する手法の研究を行ってきました.
本年度はLODとしての利便性の向上を図り,様々な標準語彙とプロパティの対応付けや他のLODとのリンクを追加しています.関係数も1500万を超え,非常に大規模なオントロジーとなっています.

下記サンプルを参照すると,WikipediaやDBpediaだけでなく,LODAC(http://lod.ac/),saveMLAK(http://savemlak.jp/wiki/saveMLAK),青空文庫(http://www.aozora.gr.jp/)と対応付けされていることがわかります.

福澤諭吉:http://www.wikipediaontology.org/instance/福澤諭吉
吾輩は猫である:http://www.wikipediaontology.org/instance/吾輩は猫である
ギアナウズラ:http://www.wikipediaontology.org/instance/ギアナウズラ
慶應義塾普通部:http://www.wikipediaontology.org/instance/慶應義塾普通部

さらに,いくつかのプロパティについてはschema.org,GoodRelationsといった有名な標準語彙と対応付けされていることがわかります.

周辺情報プロパティ:http://www.wikipediaontology.org/property/周辺情報
国籍プロパティ:http://www.wikipediaontology.org/property/国籍

下記URLから検索が可能です.
検索:http://www.wikipediaontology.org/search.html
エンドポイント:http://www.wikipediaontology.org/query/
アプリ提案・希望 DBpedia同様にハブとして広く利用していただければと思います.
関連するデータセット 2011-d015 2011-d016 2011-d019
関連するアイデア
関連するビジュアライゼーション作品
データセットの権利指定
表示—継承
原作者のクレジット(氏名、作品タイトルとURL)を表示し、改変した場合には元の作品と同じCCライセンス(このライセンス)で公開することを守れば、営利目的での二次利用も許可されるCCライセンス。
著作者または製作者 慶應義塾大学 山口高平研究室

登録情報を修正する


修正用のパスワードを入力してください。