日本語Wikipediaオントロジー
応募者の情報 | |
---|---|
ご氏名 | 玉川奨,香川宏介,森田武史,山口高平 |
ご所属 | 慶應義塾大学山口研究室 |
e-mailアドレス | s_tamagawa [at] ae.keio.ac.jp |
応募するデータセットの情報 | |
データセットの名称 | 日本語Wikipediaオントロジー |
データセットのURL | http://www.wikipediaontology.org |
データセットの概略説明 |
Wikipediaは語彙網羅性および即時更新性に優れており,半構造情報資源であることからオントロジー構築のための情報資源として非常に優れています.DBpediaもWikipediaのInfoboxと呼ばれる構造からLODを構築していますが,Infoboxは記事全体の3分の1程度しか存在していません.私たちはこれまで,日本語版Wikipediaの様々な構造を利用し,日本語に特化した大規模で汎用的なオントロジーを構築する手法の研究を行ってきました.
本年度はLODとしての利便性の向上を図り,様々な標準語彙とプロパティの対応付けや他のLODとのリンクを追加しています.関係数も1500万を超え,非常に大規模なオントロジーとなっています. 下記サンプルを参照すると,WikipediaやDBpediaだけでなく,LODAC(http://lod.ac/),saveMLAK(http://savemlak.jp/wiki/saveMLAK),青空文庫(http://www.aozora.gr.jp/)と対応付けされていることがわかります. 福澤諭吉:http://www.wikipediaontology.org/instance/福澤諭吉 吾輩は猫である:http://www.wikipediaontology.org/instance/吾輩は猫である ギアナウズラ:http://www.wikipediaontology.org/instance/ギアナウズラ 慶應義塾普通部:http://www.wikipediaontology.org/instance/慶應義塾普通部 さらに,いくつかのプロパティについてはschema.org,GoodRelationsといった有名な標準語彙と対応付けされていることがわかります. 周辺情報プロパティ:http://www.wikipediaontology.org/property/周辺情報 国籍プロパティ:http://www.wikipediaontology.org/property/国籍 下記URLから検索が可能です. 検索:http://www.wikipediaontology.org/search.html エンドポイント:http://www.wikipediaontology.org/query/ |
アプリ提案・希望 | DBpedia同様にハブとして広く利用していただければと思います. |
関連するデータセット | 2011-d015 2011-d016 2011-d019 |
関連するアイデア | |
関連するビジュアライゼーション作品 | |
データセットの権利指定 |
表示—継承
原作者のクレジット(氏名、作品タイトルとURL)を表示し、改変した場合には元の作品と同じCCライセンス(このライセンス)で公開することを守れば、営利目的での二次利用も許可されるCCライセンス。
|
著作者または製作者 | 慶應義塾大学 山口高平研究室 |