データセット部門

あなたの作品をデータセット部門に応募しよう!

データセット部門の詳細はコチラ

応募作品一覧

エントリー番号 作品の名称 応募者 応募概要 エントリー情報
d001DATA MAP 住所・駅・寺神社・学校等座標情報(横浜市・京都市)リッツ総合研究所 岩場GISマーケティング用データとして、住所・駅・寺社・学校等
各データの名称およびそれに対応する緯度・経度の座標情報
提供エリア:横浜市・京都市
※ ただし、データ利用に際しましては、非営利利用を前提にデータをご活用ください。なお、その場合でも「データ:RITS総合研究所提供」とクレジットをご明記ください。また、有償でのビジネスに本データをご活用の場合、別途弊社にご連絡願います。(tel 006-4706-6644)
d002青空文庫 形態素解析データ集河原 翔2012年12月時点で青空文庫で公開されている作品中で、作品著作権フラグがない作品のうち11,176件分のデータを形態素解析し、その解析結果を公開しています。
d003relation_tableL友人関係を表現しました
d004jojo木村勇気ジョジョについての図を示した
d005声優関係田中 太郎課題です
d006firiend_list五十嵐団十郎友人関係
d007people_list高橋孝彦周りの人々との人間関係を示した。
d008チームメイト松崎しげる人間関係を表している
d009別名義でのキャラ名名無しさん同年での別名義でのキャラをあげてみました
d010教師と生徒の関係稲葉凌太教師と生徒の関係をRDFで作成しました。
d011プレミアリーグ得点ランキング上位の関係ふーま2013年1月19日現在のプレミアリーグの得点ランキング上位者の所属チームと過去の所属していたチームの人間関係を繋いだ。得点ランキング上位層の現在と過去に所属していたチームメイトを結ぶことでそのチームの強さや現在の順位と関係があるかわかるのではないかと思い、このデータセットを作成した
d012MGS_CV松田翔平とあるゲームの声優
d013family仲田 翔家族構成について
d014seiyu_listqurail女性声優の交友関係をまとめたもの
d015ライトノベル作家一覧と作品・イラストレーター・レーベル菊池 尚也ライトノベル作家の代表作、その代表作のイラストレーター、主に活躍するレーベルをまとめた。 作家と作品はfoaf:publications関係、作家とイラストレーターはfoaf:knows関係。
d0162012年サッカー日本代表選手同士の所属関係taka2012年にサッカー日本代表に招集された全50名と同じクラブチームに所属している もしくは 所属していた選手(2012年に招集された他の49選手の中から選出)をfoaf:knowsで関連付けました。
d017犬神家の一族 (1977年)・主要登場人物と俳優の関係大家 史裕1977年に放送された古谷一行主演、横溝正史シリーズ・犬神家の一族を関連付けた
d018ソクラテス以前の哲学者の人間関係江上周作ソクラテス以前の哲学者の師弟関係や知人関係を表現しました。
d019ゲーム開発会社と有名ゲームtatsuya_hsゲーム開発会社と有名ゲームの関係
d020LSJ2013ほえほえ【LOD作品の目的】

LSJ(Location Site of Japanimation)はサブカル作品(アニメ, ゲーム, 漫画)舞台の情報データベースです. これまで同人ソフトウェア開発者間でのデータ流通, 共有化による生産性の向上, LODを利用したクロスオーバー作品の創発などを目的にLSJのLOD化を進めてきました.

【LSJ2012からのアップデート情報】

本年は舞台探訪アプリに必要なデータの追加・修正を行いました. 特にNTTレゾナント様の『おでかけルートナビ PinQA』のLOD API を活用し, より高精度な舞台探訪データを従来のLSJ2012とリンクしたところが新しいです.

また, 二次利用しやすいようLSJ2013 LOD中で使用した語彙のオントロジーを整備. データのダウンロードに加えSPARQLエンドポイントの提供. 開発ノウハウを共有するためのドキュメント整備を行いました.


【データ特性】

サブカル(アニメ・ゲーム・漫画)作品の登場舞台をDBpediaやPinQAとリンク. 昨年度の投稿作品LSJ2012からデータの追加・修正. 表形式/TSV/RDFデータ, オントロジー(OWL), SPARQL endpoint, アプリケーションの提供.



LSJ2013は下記サイトからご利用いただけます.

http://cheese-factory.info

d021ツタンカーメンの一族yukiDNA鑑定で明らかになった、ツタンカーメンの一族の関係を示しました。
d022ゲーム作品Fateに登場するキャラの主従関係白土寛之ゲーム作品Fateに登場するマスターとサーヴァントの関連を記述した。
d023ドラえもんの主要人物の人間関係奥田 裕樹ドラえもんに登場する主要キャラクターの人間関係を表現しました。
d024YukariTamura_CharacterListitumono田村ゆかりさんが演じたアニメキャラクターをまとめたもの
d025NTTの系列会社takashi muramatsuNTTの系列会社をまとめました
d026スタジオジブリ劇場公開作品一覧遠藤稜典スタジオジブリ劇場公開作品一覧とその監督
d027名探偵コナンの登場人物リストMASAKI.S人気コミック「名探偵コナン」に登場する主な人物のリストです。
d028Boeing_listKATSUTOSHI IWAIボーイング航空機とその初飛行年
d029Amagasaki_Serial_Killer_SuspectedYudai尼崎コンクリート事件の主要人物(名前の掲載されている人物のみ)を取り上げ、角田美代子との関係・年齢・生死について記述しました。
d0302ちゃんねる掲示板のスレッドデータ吉田光男2006年以降に投稿された「2ちゃんねる掲示板」のスレッドデータです。3500万件以上のスレッドタイトルと700件以上の掲示板とを関連づけています。
d031市内避難所鯖江市役所情報統計課鯖江市内の避難所の施設名、位置情報
d032消火栓情報鯖江市役所情報統計課鯖江市内の消火栓の名称と位置情報
d033コミュニティバスの位置情報鯖江市役所情報統計課鯖江市が運営するコミュティバス”つつじバス”の運行情報
d034日本さくら名所100選菊池 尚也財団法人日本さくらの会が1990年(平成2年)に、全国各地の桜の名所から100か所を選定したものです。
d035青空文庫 Linked Open Data落合香織青空文庫で公開されている作品の書誌情報を新たにRDFの形式に変換を行いました。また、国立国会図書館が提供する国立国会図書館サーチ、典拠データ検索・提供サービスであるWeb NDL Authorities、Wikipediaのデータを持つDBPedia(Japanese)と連携を行いました。
d036国会会議録データセット(対話コーパス)中村聡史国会会議録システム(http://kokkai.ndl.go.jp/SENTAKU/index.htm)から衆議院,参議院,両院協議会の1947年から2012年末日まで65年にわたる会議録から,
・発言日
・会議録上の発言者名
・名寄せした発言者名
・名寄せした発言者の役職名
・発言内容(句点までを1区切りの発言として扱っています)
・会議録のURL
をタブ区切りで整形したデータです.総発言数は約4840万(総発言長は約35億文字.展開後のファイルサイズは16GB程度)になります.
会議録上の発言者名は略記されるうえ,元データはまったく構造化されていないベタ書きのHTMLデータ(空白や改行によりなんとなく構造化されています)であり,国会会議録は議事録作成者にかなり左右されることがあるため,名寄せでかなり工夫しています.
実際には,会議録上の発言者名をもとに,会議録内で参加者一覧と思われる場所を発見し,会議録上の発言者名の部分一致で最適合する名前らしき部分を人物名として抜き出すようにしております.(元データ(特に参加者一覧)はかなり作成者依存なので一度ご覧になる事をおすすめします).
なお,一部会議録作成者のタイプミスなどによって正常に名寄せできていないものもあります.ただ,その数は総量から考えるととても少ないので,分析上無視出来るレベルであると考えています.
d037横浜歴史フィールド・ミュージアムAR横浜歴史フィールド・ミュージアムAR<メンバー>
上野直樹、関口昌幸、秋元慶太、 谷杉歩音、大崎 敬志朗、
朝香貴裕、藤川恵一、嘉門保夫、杉浦裕樹、広田盛一、生島高裕
<作成データ>
 「横浜歴史フィールド・ミュージアムAR」データ
 DBpediaからデータをSPARQL検索して作成する。
<元データ>
歴史関連データ
(1) 歴史的建造物、サンプル、当時の絵葉書から
横浜道のオーバーレイしたjunaioサンプル
(2) 歴史的建造物
http://ja.wikipedia.org/wiki/%E6%A8%AA%E6%B5%9C%E5%B8%82%E8%AA%8D%E5%AE%9A%E6%AD%B4%E5%8F%B2%E7%9A%84%E5%BB%BA%E9%80%A0%E7%89%A9
(3) 発祥地
前田サイト、wikipediaの馬車道の項目にあるリスト
前田サイト
http://yokohamamap.blogspot.jp/
wikipediaの馬車道の項目
http://ja.wikipedia.org/wiki/%E6%A8%AA%E6%B5%9C%E9%81%93
(4) 開港前後
・1854 日米和親条約、開港資料館のあたり、横浜市中区日本大通(横浜港開港広場)
現横浜開港資料館所在地)に応接所
http://ja.wikipedia.org/wiki/%E6%97%A5%E7%B1%B3%E5%92%8C%E8%A6%AA%E6%9D%A1%E7%B4%84
・1863 海岸通り(バンド)
・1859 横浜道
http://ja.wikipedia.org/wiki/%E6%A8%AA%E6%B5%9C%E9%81%93
・吉田橋、前田橋、関所、1959
・馬車道 1967前後
下岡蓮杖 吉田橋わきに成駒屋という乗合馬車を作る。
http://ja.wikipedia.org/wiki/%E9%A6%AC%E8%BB%8A%E9%81%93_(%E6%A8%AA%E6%B5%9C%E5%B8%82)
日本初が多い。
歴史的建造物も多い。
・港崎遊郭、横浜公園
http://ja.wikipedia.org/wiki/%E6%B8%AF%E5%B4%8E%E9%81%8A%E9%83%AD
・日本大通り 大火
・英一番館
・イギリス波止場、フランス波止場
・大さん橋、象の鼻
http://ja.wikipedia.org/wiki/%E5%A4%A7%E3%81%95%E3%82%93%E6%A9%8B
・神奈川運上所 wikipediaなし
その西側を日本人町、東側を居留地とした。
マップ
http://www.timeslip-y.jp/kannai/unzyo-map.html
http://www.timeslip-y.jp/kannai/unzyosyo.html
d038日本語Wikipediaオントロジー玉川奨,香川宏介,森田武史,山口高平Wikipediaは語彙網羅性および即時更新性に優れており,半構造情報資源であることからオントロジー構築のための情報資源として非常に優れています.DBpediaもWikipediaのInfoboxと呼ばれる構造からLODを構築していますが,Infoboxは記事全体の3分の1程度しか存在していません.私たちはこれまで,日本語版Wikipediaの様々な構造を利用し,日本語に特化した大規模で汎用的なオントロジーを構築する手法の研究を行ってきました.
本年度はLODとしての利便性の向上を図り,様々な標準語彙とプロパティの対応付けや他のLODとのリンクを追加しています.関係数も1500万を超え,非常に大規模なオントロジーとなっています.

下記サンプルを参照すると,WikipediaやDBpediaだけでなく,LODAC(http://lod.ac/),saveMLAK(http://savemlak.jp/wiki/saveMLAK),青空文庫(http://www.aozora.gr.jp/)と対応付けされていることがわかります.

福澤諭吉:http://www.wikipediaontology.org/instance/福澤諭吉
吾輩は猫である:http://www.wikipediaontology.org/instance/吾輩は猫である
ギアナウズラ:http://www.wikipediaontology.org/instance/ギアナウズラ
慶應義塾普通部:http://www.wikipediaontology.org/instance/慶應義塾普通部

さらに,いくつかのプロパティについてはschema.org,GoodRelationsといった有名な標準語彙と対応付けされていることがわかります.

周辺情報プロパティ:http://www.wikipediaontology.org/property/周辺情報
国籍プロパティ:http://www.wikipediaontology.org/property/国籍

下記URLから検索が可能です.
検索:http://www.wikipediaontology.org/search.html
エンドポイント:http://www.wikipediaontology.org/query/
d039デジタル台風北本朝展デジタル台風は、台風に関する現在から過去の多種多様なデータを検索可能なウェブサイトです。1978年以来の気象衛星画像、1951年以来の台風経路データ、1976年以来のアメダスデータなどの気象データを中心に、気象災害データや数値予報モデルデータ、オンラインニュースデータ、ソーシャルメディアデータなどのデータが、それぞれ何らかのリソースを介してつながる形でアーカイブされています。またデータの一部はKMLやRSS、Atom等の機械可読データとして提供しており、これを使って他のサービスを構築することもできます。実際に、我々が構築したブログパーツ「台風画報」だけではなく、他者が開発したiOSアプリやchumbyアプリなどでも、これらの機械可読データを用いて動作しているものが既にあります。現状ではRDF形式で提供するデータはありませんが、サイトの概念構造は台風番号など各種のリソースを核としたリンク構造として実装しているため、これをLODとして利用しやすい形式で出力することは、語彙さえ定めれば実施可能であると考えています。なおライセンスについては、将来的にはよりオープンなライセンスに移行したいとは考えていますが、現状では最終判断を下せないため「全ての権利を主張」に設定しています。
d040オープンデータ活用事例東 富彦オープンデータ活用した事例を集めたデータセットです。オープンデータとは、公的機関が保有するデータを民間に開放し、社会的課題解決からビジネスまで幅広く活用することによって、より良い社会の実現を目指す世界的な運動です。本事例集には、32ヶ国401事例について、事例の詳細、開発者、ビジネスモデルなどのデータが収録されています。
d041Namespaces and Vocabularies本間維prefix.ccで公開されている名前空間リストと,実際の語彙定義ファイルとを関連付けたデータです.
メタデータ記述語彙を調べるためのSPARQLエンドポイントを構築したい場合などに,語彙定義ファイル収集先の一覧として利用できます.
詳細は http://mdlab.slis.tsukuba.ac.jp/lodc2012/vocab/ と https://github.com/tsunagun/vocab を参照してください.
d042「SmartTown」実現のための自治会町内会予算分類基準COFOT竹内久知データセット部門 「SmartTown」実現のための自治会町内会予算分類基準COFOT
(Classification of the functions of town)
データセットの名称のURL http://linkdata.org/work/rdf1s570i

その他のデータセット
cofot.xlsx http://goo.gl/GG134
hodogaya.xlsx http://goo.gl/uo4Df
yosan_kanren.xlsx http://goo.gl/YmNnL
yosan_kesan.xlsx http://goo.gl/fdcQw
dataset.csv http://goo.gl/6TO3p
データセットの解説http://goo.gl/vBM1d

「SmartTown」では、予算関連データをよりよく理解するための手始めとして、自治会町内会予算の分類コード体系と自治会町内会収入・支出科目分類表を組み合わせ、全国地域の自治会町内会の標準としての自治会町内会予算分類基準COFOT(Classification of the functions of town)原案を策定し、トライアル後に完成版に仕上げていく計画で作業を進めています。このCOFOT分類基準は国連の策定したグローバルスタンダード政府決算統計用国際標準COFOG(Classification of the functions of government)の3階層構造を解析し、集約して、準拠させています。COFOT原案策定と同時に、地方自治体予算に関して約3,000事業を超える横浜市事業計画書のデジタル化を終え、解析・データマイニングによりデファクト・スタンダードを目指した国際自治体予算比較基準COFOLG(local government)の原案作りを始めており、COFOTはCOFOL等への上位互換性を備えた体系となっています。

「SmartTown」では、財政的な基盤の充実のために、地方自治体(横浜市)と地域(自治会町内会)の財政に関するデータのオープンデータ化を進め、予算関連データの可視化により地域住民がより解りやすく、学習し、理解し、地方自治体、自治会町内会、地域住民が対話するための手段としてICTを活用し、地方自治体予算の意義・意味(どのように市民に有効か)と効果(一人ひとりが実感できること)が市民に理解できるようにする手段と、さらに市政の広報活動を担っている自治会町内会単位でその地域で予算がどのように使われ、市民がそれらをどのように評価しているかを知る手段の提供により、行政に対して社会を良くすること、私達の町も良くするための地域(自治会町内会)財源充実のための提言を行えるソリューションを提供します。
d043Linked Paper三宅明日香「Linked Paper」は論文間の内容の類似度を分析することで、関連性の高い論文を表示させるシステムです。
研究を行うためには、ある研究テーマを設定し、それに関連する論文を探し続ける必要があります。通常はCiNiiなどを使ってキーワード検索を行いますが、それだけでは関連する論文を探し出すのは難しいと考えられます。そこで、論文の内容に基づいて論文をリンクさせ、内容が近いものをランキングで表示し、たどっていけるシステムを提案しました。これによって、関連性の高い論文を探し出すのが簡単になります。また自分が検索してきたキーワードでは出てこなかった、意外な関連論文も読むことができるので、考えも膨らむのではないかと考えられます。このシステムは、研究を行う学生や学者にとって有用なものになるだろうと考えています。
d044ご当地グルメ日吉健人各地域のご当地グルメの概要、味覚、温度、主成分と地域名をまとめたもの。
d045JAXA宇宙航空データリストデータ利用環境整備チーム(U-USE)宇宙航空研究開発機構(JAXA)が所有する宇宙および航空に関連するデータのうち、地球観測衛星を中心として外部機関と何らかの形で共有しているデータの一部をリスト化し公開します。(2013年1月時点)。今後宇宙航空データのオープン化を促進するきっかけにしていきたいと思います。
d046Ranking of Author and Journal梶浦美咲【概要】
「Ranking of Author and Journal」はCiNiiでの論文検索結果から、その検索キーワードと関連性の高い重要な著者・刊行物のランキングを生成するシステムです。

【研究における問題点】
本来、自分の研究における重要なキーワードが分かったとしても、そのキーワードにおける重要な著者や刊行物が分からず、研究に関連しそうな重要な論文を読むことは困難です。
CiNiiでの現状として、関連著者・関連刊行物を示すカラムが既に存在しますが、そこからは関連性の高いものでのランキングは行われていません。

【解決策】
そこで、キーワードによって検索されたものの中から、そのキーワードに関連性の高い重要な著者・刊行物のランキングを生成するシステムを提案します。関連性の高い著者や刊行物が分かれば、自分の研究に関係しそうな他の論文も読むことが可能になります。
それにより、自分の研究分野に対する理解を更に深めることができると考えられます。
d0472010年度 国勢調査白山英一平成22年国勢調査から、人口等基本集計(男女・年齢・配偶関係,世帯の構成、外国人(地域別総数、男性数、女性数、世帯人員(7区分),65歳以上世帯員の有無別一般世帯数,一般世帯人員及び65歳以上世帯人員 )、また、都道府県別医療施設数、都道府県別医療関係者数、都道府県別地域保健活動状況、都道府県別生活保護法による被保護実世帯数と実人員、都道府県別農家数と農家人口(販売農家)、都道府県別主要家畜・鶏の飼養戸数,飼養頭羽数と生乳・鶏卵生産量 等々。

平成22年度の国勢調査の調査結果データを自由に簡単に2次利用を可能にすることが目的。 境域年次は2010年のものを抽出した。
d048CiNii 拡張プロジェクト山口貴弘論文検索サイト CiNii の機能を拡張し、利便性を高めることを提案します。
・CiNii に登録されている論文を、予め分類しておき、国会図書館のように検索できるようにする。
・CiNii の RDF データを利用して論文同士の関連性を可視化する。
・他の論文ベースとの接続し、LOD として拡張する。
・(ユーザーが) OpenSearch の結果を 4store などの RDF ストレージに蓄積して再利用する。
・論文検索結果から関連した論文をレコメンドするサービスを行う。
d049Astro Database山口貴弘オープンになっている天体観測結果のデータベースを RDF 化したもの。
d050SUBA RDF重光 俊亮シロイヌナズナのタンパク質の細胞内局在化部位をまとめたデータベースであるSUBAをRDF化しました。また、SUBAとBioLODなどへのリンクも作成しました。

引用文献:Tanz, S. K. et al. SUBA3: a database for integrating experimentation and prediction to define the SUBcellular location of proteins in Arabidopsis. Nucleic Acids Research 41, D1185–91 (2012).
d051depicts.azurewebsites.net松澤有三既存の地理ポリゴンデータをオープンデータとして使いやすいように加工・配信する試みです。

【データセット】
加工成果として地球観測ポリゴン (14), 国ポリゴン(238), 都道府県ポリゴン(47) を CC-BY で公開します。市区町村ポリゴン(1,907) は元著作の利用規約に従い、All Rights Reserved として参考公開します。

http://depicts.azurewebsites.net/

【課題】
地理データは Shape や KML といったフォーマットのファイルとして、オープン
ライセンスで公開されることも多くなってきました。
しかしこのようなファイルはデスクトップアプリでの利用を前提としたり、特定のオンラインサービスで使ったり、といった使用方法が一般的です。それ自体の URL が顧みられることは少ないのではないでしょうか?
「リンクして使うデータ」としては心もとなく、FiveStar の評価は 2~3 あたりでしょうか。もったいない。

【データ】
地理データのポリゴンデータを小さな単位の SVG 形式に加工して配信します。SVG には以下のメタデータが含まれます
・加工元への参照
・ライセンス
・GeoNames への参照
・地球観測ボキャブラリを使ったトピックの記述

また、データとしての再利用性を重視して、SVG の構造は単純化しています。ルート svg 要素の直下に polygon 要素がおかれ、座標値として経度緯度が無加工で設定されています。
d052平成24年度横浜市予算【部局別主要事業明細】データ「税金はどこへ行った?」チームメンバWhere Does My Money Go? 日本語版プロジェクトで構築したWebサイト http://spending.jp/ で利用している横浜市の主要事業の予算データを Linked Open Data (LOD) にしたものです。
主要事業に対応した横浜市の部局の情報もLOD化し、主要事業の部局とspending.jpの予算カテゴリ(分野)とをリンクさせています。
http://linkdata.org/work/rdf1s187i/apps (投稿データとは別のデータです。)
データモデルについては以下のスライド(p.4)をご覧ください。
http://www.slideshare.net/HiroyukiSato1/lod-for-yokohama-city-budget-plan
d053藤沢市のオープンデータLOD藤澤伸藤沢市に関する情報、現在は主に施設・スポットの情報をLOD化しています。具体的には、藤沢市のグルメスポット情報・避難場所の情報・幼稚園の情報が、RDFファイルおよびsparql検索で取得可能です。 (sparql end point: http://data.sfc.keio.ac.jp/sparql )
d054参議院議員リスト黒川奈桜子2013/1/29現在の参議院議員情報をCSV形式でまとめたファイルです。
http://www.sangiin.go.jp/japanese/joho1/kousei/giin/183/giin.htm 以下にある情報を元にしました。
以下の項目が含まれています。
・ID No.(参議院による議員紹介ページのURLから抽出したものです。ユニークですが連番ではありません)
・氏名(苗字と名前の間を半角スペースで区切ってあります)
・出馬エリア(都道府県名もしくは比例)
・次回選挙日程(H28.7.25もしくはH25.7.28)
・所属政党
・当選した年度(複数回当選の場合には\
d055函館まちあるきルート情報公立はこだて未来大学 高度ICT演習観光系プロジェクト高度ICT演習観光系プロジェクト
M1:高橋正輝、坂井麻里恵
B3:岸野亜理沙、佐藤正徳、武田泰典、似内勇太、前田実優、松田隼士、山田亜美
B2:安藤大岳、伊林謙太、小野美郁、工藤卓也、西本光司、兵藤允彦
アドバイザー M2:永峰和弘 指導教員:奥野拓

函館まちあるきルート情報
函館市が提供している「函館まちあるきマップ」(http://www.city.hakodate.hokkaido.jp/kankou/hako_machi/)のRDFデータを作成しました。「函館まちあるきマップ」とは、 函館の街並みを歩きながら楽しむことできるルートを掲載した紙媒体の地図です。このRDFデータには、「函館まちあるきマップ」全22コース分の、それぞれのコース名、所要時間、距離、消費カロリー、ルート上にある観光スポット名を含めました。
d056函館映画ロケ地情報公立はこだて未来大学 高度ICT演習観光系プロジェクト高度ICT演習観光系プロジェクト
M1:高橋正輝、坂井麻里恵
B3:岸野亜理沙、佐藤正徳、武田泰典、似内勇太、前田実優、松田隼士、山田亜美
B2:安藤大岳、伊林謙太、小野美郁、工藤卓也、西本光司、兵藤允彦
アドバイザー M2:永峰和弘 指導教員:奥野拓

函館映画ロケ地情報
函館市が提供している「はこだてフィルムコミッション」(http://www.hakodate-fc.com/)のRDFデータを作成しました。「はこだてフィルムコミッション」とは、函館で撮影された映画のロケ地情報を掲載したWebサイトです。このRDFデータには、映画タイトル、監督、主演、ロケ地となったスポット名、ロケ地で撮影されたシーンの内容を含めました。
d0572009年~2012年に刊行されたライトノベル一覧黒川奈桜子「ラノベの杜」http://ranobe-mori.net/に掲載された情報を元に2009年1月から2012年12月までに刊行されたライトノベルをCSV形式でまとめたファイルです。以下の情報が含まれています。
・発売日(yyyy/(m)m/(d)d)
・レーベル
・書名
・著者
・イラストレーター
・価格
・ISBN
d058函館土木遺産情報公立はこだて未来大学 高度ICT演習観光系プロジェクト高度ICT演習観光系プロジェクト
M1:高橋正輝、坂井麻里恵
B3:岸野亜理沙、佐藤正徳、武田泰典、似内勇太、前田実優、松田隼士、山田亜美
B2:安藤大岳、伊林謙太、小野美郁、工藤卓也、西本光司、兵藤允彦
アドバイザー M2:永峰和弘 指導教員:奥野拓

函館土木遺産情報
「函館近代化遺産ポータルサイト」(http://hnct-pbl.jimdo.com/ )のRDFデータを作成しました。「函館近代化遺産ポータルサイト」とは、函館の歴史ある土木建築物(ダムや堤防など)の情報を掲載したWebサイトです。このWebサイトは函館工業高等専門学校のPBLで株式会社ノース技研の指導の下に作成されました。このRDFデータには、土木建築物の名前、概要、住所、緯度・経度、施工者、竣工年を含めました。
d060マウス・フェノーム理研BRC マウス表現型知識化ユニット生物の表現型を、生命科学分野のオントロジーを用いて、網羅的に表現するRDFの形式を策定しました。これを用いて、バイオリソースセンターに寄託されているマウスの表現型をまとめています。このデータは、https://database.riken.jp/sw/ja/表現型アノテーション/cria315s5i/ において、表形式でブラウズできる他、前回投稿したマウス系統そのものと組み合わせて、https://database.riken.jp/sw/ja/C57BL_6-KitW-v__/cria315s1ria315u100000000142i/ のように、同じ表現型のマウス情報を収集することにも役立っています。
d061地方自治体Facebookページ庄司昌彦国際大学GLOCOM地域SNS研究会として、庄司昌彦、林雅之、菊地映輝が作成した2013年1月時点の日本国内の地方自治体Facebookページのリストです。都道府県、政令指定都市、県庁所在地+αをカバーしています。
d062横浜市ごみ分別情報LOD藤澤貴智,清水たくみ,小林巌生ゴミ分別は地方自治体毎に独自のルールがあり、引越をするたびに学習必要がありますが、横浜では他の地域と比較しても複雑です。横浜市のごみと資源の分別情報を整理し、回収区分、回収日情報とともにLOD化を実施しました。今回、ごみ品目の情報や分別ルールをLOD化することでよりこれまで出来なかった柔軟な問い合わせが可能になりました。

出典元は横浜市資源循環局です。本データ作成にあたり使用許可を頂き作成しました。また、ごみ品目の例外的な出し方の情報の抽出などの編集については、藤澤貴智(横浜市在住)によって行なわれました。

エンドポイントにはSPARQLEPCUを使わせてもらいました。
http://lodcu.cs.chubu.ac.jp/SparqlEPCU/project.jsp?projectID=gomi_yokohama
d063京都国際マンガミュージアム書誌情報LODカ ブンリン京都国際マンガミュージアムから提供いただいた所蔵マンガの書誌データをLOD化し、一冊一冊のマンガの本のデータから作品シリーズのデータとして利用できるように再構成しました。また作品シリーズをDBpedia Japaneseと紐付けしました。

協力:京都精華大学 国際マンガ研究センター http://imrc.jp/
d064横濱写真アルバムLOD肥田野正輝、伊藤宗太、荒木泰介、小林巌生横浜開港150周年 みんなでつくる 横濱写真アルバム(http://www.yokohama-album.jp)は横浜商工会議所の横浜開港150周年事業として公開されました。地元の企業や市民より1万枚を超える写真が投稿されており、中には横浜の歴史を映した古写真も多く、興味深いコンテンツを数多く有しています。ウェブサイト自体に検索APIも備わっていますが、今回、横濱写真アルバムの存在を広く知ってもらい、また、写真を活用してもらうためにLOD化にチャレンジしました。横浜オープンデータハッカソンの場を借り、Linkdata.orgを活用することで、短時間でデータの作成を終えることができました。

<データの内容>
クリエイティブ・コモンズ ライセンスが指定してあるもののみ、2756枚をLOD化しました。
メタ情報としてタイトルや説明文の他、緯度経度、撮影日時、なども含まれます。

<ライセンス>
データのライセンスはCC-BYとしますが、写真自体のライセンスは個々にCCライセンスが設定されています。
d065公共施設マップ会津若松市 情報政策課市及び公共的な施設の連絡先及び地図データ
d066毎月1歳毎年齢別人口会津若松市 情報政策課住基人口の月毎の年齢別、男女別の人数
d067毎月大字別人口会津若松市 情報政策課住基人口の年齢毎、大字毎の男女別の人数
d069西山動物園の動物情報鯖江市役所情報統計課西山動物園の動物一覧です。鯖江市生まれのレッサーパンダは全国の動物園にいます。これらの動物の戸籍につながるような個体情報を目指しています。
d070鯖江市文化財情報鯖江市役所情報統計課鯖江市内の文化財の写真、説明などの情報です。
d071Genia Event Extraction Task Set 2013金進東、王悦、山本泰智本データセットはアプリケーション部門に応募しているPubAnnotationシステムを使って開発された論文アノテーションのデータセットである。下記の背景は、アプリケーション部門に応募している a037、PubAnnotationについての記述と同じ内容である。

【背景】
・論文に書かれた膨大な生命科学知識
生命科学分野では、研究の成果は主に自然言語で書かれた論文という形で出版されるが、そこに記述されている様々な知識の量は膨大で、特定の分野の専門家ですら関連する全ての論文を読み、把握することは非常に困難な状況である。そこで、機械的な処理により、論文中から、生命科学において重要な概念である遺伝子やたんぱく質に関する記述を自動的に抽出する技術が開発されている。

・機械を用いた解決策
より良い精度を得るために、まず最初に領域の専門家が、それらの概念を表す語(領域固有語)を特定し、機械はそれを手本として同じ結果を出すべく動作するようプログラムされる、という手法が取られている。この、領域固有語を特定する作業をここではアノテーションと呼ぶが、これは、航空写真に写る駅やレストランなどの建物にラベル付けしていく作業と似ている。現在、世界各地の様々な研究機関がアノテーションを行い、独自の形式で公開しているため、複数のアノテーションデータを集めて統合し、利用することが困難であるという問題点がある。また、アノテーションおよびそれに必要な準備の双方ともに非常に手間ひまのかかる作業である。

・アノテーションデータの構築
人間の免疫機能に深く関係するたんぱく質であるNFkBの制御に関する最新の論文を集め、領域の専門家が、論文中に書かれているたんぱく質名とその他の物質名を特定し、それらの物質間で起こる様々な生物的現象(たんぱく質の相互作用や遺伝子発現の制御等)を細かく構造化した形式で記述した。
本データセットはそれ自体でLODセットとして公開されており、また、同様のアノテーションを自動化するシステム開発の国際チャレンジ会議であるBioNLP Shared Taskの一つのべンチマークデータとしても使われている。今後は、上記の分野以外の論文に対しても同様のアノテーションデータが様々な組織で構築され、公開されることを期待している。

・統計
論文数:20本
アノテーションされたデータの量:128,776 triples
d072地域SNS参考文献リスト菊地 映輝国際大学GLOCOM地域SNS研究会として、庄司昌彦、菊地映輝が作成した2011年12月末時点での地域SNS参考文献リストです。
d073Girls Fashion Data中尾 京子,洞渕 彩未【 ファッションについてのデータセット 】

BrandList
女性ファッションブランドについてまとめたデータセット

BrandListByMagazine
雑誌に掲載されているブランドリストをもとに分類した女性ファッションブランドのデータセット

magazineType
雑誌をファッションスタイルごとに分類したデータセット

photo_to_magazine
ファッションスタイルを表現している写真と写真に近いスタイルが掲載されている雑誌を分類したデータセット
d074鯖江市農産物直売所鯖江市役所情報統計課市内の農産物直売所
d075鯖江市議会議員情報鯖江市役所情報統計課鯖江市議会議員の情報
d076九州の温泉地一覧日高 雄介九州にある温泉地の一覧です。それぞれの温泉地の効能や泉質、最寄り駅などの情報を含んでいます。
d077温泉の効能一覧日高 雄介温泉の泉質別効能の一覧です。
d078Open DATA METI経済産業省経済産業省自身(所管の独立行政法人等を含む)の保有データを対象にデータ公開の環境整備を図り、実際に公開を進めるとともに、公開データを利活用したビジネスが展開する社会基盤を整えていくことで、オープンデータによる経済活性化の促進を図る目的で推進されるDATA METI構想。その取り組みの一環でデータカタログサイト「Open DATA METI」を公開しました。現在は統計データと白書データを登録しています。
本サイトはオープンソースであるCKANを応用し構築しており、データセットに関するメタ情報はLODとして取得できる他、APIを利用することでもデータにアクセスすることが可能です。
登録されているデータはクリエイティブ・コモンズ・ライセンスを採用しており、自由に利用していただけます。
詳しくはOpen DATA METIのウェブサイトをご覧ください。
d079ダジャレで世界旅行♡佐藤 貴未 従来のLODデータにはない「地名に関連するダジャレ」のデータ化という新たな分野にチャレンジしました。
 本データは、1,066種のダジャレを有しています。うち約750件は「地名ダジャレ chakuwiki」を参考にさせていただいており、その他のものはオリジナルもしくは、様々なホームページ上から引用しました。
 また、データの中には、地名の緯度・経度の情報が含まれています。これにより、Google Mapと関連づけることで、地図上にその地に関連したダジャレを表示させることが可能となりました。また、緯度・経度は、その土地の中央値だけではなく、その地名の範囲を示すべく領域の左上の座標の緯度・経度、そして右下の座標の緯度・経度も入力しました。本データの応用には、地理空間情報が含まれるゲームや、GPS機能を有した端末を所持した者に対して、その地に関連するダジャレを再生する音声アプリケーションなどが考えられます。
 多くの人々に、ダジャレを通じてユーモアを寄与できる作品だと考えています。
d080セマンティックWebコンファレンス講演情報s3worksセマンテックWeb委員会が開催した「セマンティックWebコンファレンス」での講演情報をLinked Open Data化したものです.SPARQLによる検索も可能です.講演者の所属は,開催当時のものです.現在,2012年の講演情報のみです.
d081日本のデータカタログサイトCKAN日本語コミュニティ本サイトは日本のデータカタログをまとめるという目的で,有志のコミュニティが運営しています.サイトにはデータポータルソフトウェアであるCKAN(http://ckan.org)を用いています.2013年1月31日現在,オープンガバメントを推進している地方公共団体のデータを中心に,125のデータセットがまとめられています.

データカタログは三通りの方法で利用可能です.一つはLinked Data,もう一つはデータダンプ,最後はCKAN APIです.まず,個々のデータカタログはLinked Dataとして提供されています.現在はCKANを改造してあり,RDF/XMLとN3形式で取得可能です.例えば鯖江市人口,気温のRDF/XMLはhttp://data.linkedopendata.jp/dataset/sabae-tokei.rdf, N3はhttp://data.linkedopendata.jp/dataset/sabae-tokei.n3になります.curl -iH \'Accept text/n3\' http://data.linkedopendata.jp/dataset/sabae-tokei のようにContent-negotiationにも対応しています.

次に,データカタログ全体については,データダンプとして http://data.linkedopendata.jp/dump/ でCSVとJSON形式にて提供されています.これは毎日更新されています.

最後に,APIについての詳しい説明はCKANのドキュメント (http://docs.ckan.org/en/latest/api.html) をご参考ください.サイトのアカウントを作成し,API keyを取得すれば誰でも利用可能です.
ライセンスはODbL (オープンデータベースライセンス, http://opendatacommons.org/licenses/odbl/1.0/) になります.ODbLはOpen DefinitionのConformant License (http://opendefinition.org/licenses/)として認められているライセンスです.クレジット表記は CKAN Japanese Community でお願いします.
d082Google Trends meets DBpedia Japaneses3worksDBpedia Japanese に登録されていないトレンドワードを収集したデータセットです.ScraperWiki を利用して Google Trends 日本語版を毎日1回スクレイピングして,トレンドワード上位20件を取得.各ワードを DBpedia Japanese に完全一致で問い合わせし,登録語にはIRIを付与しています.
d083疾患連鎖LOD古崎晃司,加藤敦丈,今井健,大江和彦,溝口理一郎「異常状態の因果連鎖」に基づいた疾患定義と,その患者に典型的に見られる異常状態(原因や症状)の因果連鎖に関するデータセットです.6つの診療科の代表的な約1,800の疾患に含まれる,約15,000の異常状態について,臨床医によって記述された因果関係がデータ化されており,
・各疾患がどのような原因で発症し,どのような症状を引き起こすか?
・ある異常がどのような因果連鎖を経て,どのような状態を引き起こし,どのような疾患となるか? …
といった情報を得ることが出来ます.
 データセットの公開方法としては,下記の2つのWebサービスを提供しています.(共にiOS,Android端末にも対応).
・疾患連鎖LOD Viewer
疾患連鎖(疾患定義に含まれる因果連鎖)の可視化システムです.
-「疾患の分類(is-a)階層」から表示する疾患を選択
-「疾患名」,「その疾患に含まれる異常状態名」から疾患定義を検索
の何れかで選択した疾患連鎖を可視化して表示します.
・SPARQL Endpoint
簡易クエリ入力支援機能付きのSPARQL Endpointです.
通常のSPARQLクエリによる検索に加え,
- 検索結果から選択したリソースの可視化
- 検索結果が疾患の場合は,上述の「疾患連鎖LOD Viewer」と連携して疾患連鎖を可視化
ができます.
  
※なお,本データセットは「厚生労働省医療知識基盤研究開発事業」の助成を受けて開発中の成果である「疾患オントロジー」の一部を公開しているものです.
今後,データセットの更新,利用方法の詳細などにつきましては,公開サイトにて随時,ご案内する予定です.
d084落語家LOD本間維落語家の名跡の変化や,落語家間での名跡の継承などを表現したデータセット.
d085LODC Works本間維LOD作品のLOD.

LODチャレンジ2011と2012で公開された作品の情報をRDF化したデータセットです.
各作品のエントリーシートに記述された内容を元にデータを作成しています.
「関連するデータセット」などの項目も利用して,年度や部門を超えた作品の参照関係を記述できました.
エントリー〆切後に再度データの更新を行う予定です.
d0862012年の衆院選に関するメディア情報LOD越川兼地(学生)メディア情報から事象情報を抽出し,Linked Dataで事象情報を表現する手法を用いて,2012年12月に行われた衆院選に関するマスメディア(大手ニュースサイト)及びソーシャルメディア(Twitter)の情報をLinked Dataにしたものです。

詳しくは
http://benzaiten.ohsuga.is.uec.ac.jp/k-koshikawa/MediaLinkedData/media_lod.pdf
を参照して下さい。
d087MPLOD & MPO川島秀一、岡本忍本データセットは、微生物のいくつかの表現型に関する情報をLOD化したものである。
表現型とは、外部から観察可能な生物の示す形態や生理等の形質を意味し、遺伝情報とともに、生命現象を研究する上で重要なデータである。しかし、遺伝情報が、ゲノム配列情報として急速に蓄積されている一方で、表現型の情報は主として文献に記載されていることから、網羅的な電子化は遅れている。DBCLSでは、ゲノム配列のRDF化を進めており、表現型の情報が同じくRDF化されれば、これまで困難であった遺伝情報および表現型情報を統合したデータ検索が可能になる。幸い、微生物に関しては、ゲノムプロジェクトのメタデータを整理したGOLDデータベースにGOLDデータベースに表現型情報が蓄積されつつある。今回我々は、微生物表現型情報を記載するのに必要なオントロジー、MPO: Microbial Phenotype Ontology を開発し、さらにMPOを利用して、GOLDデータベースに記載された表現型情報のうち、細胞の形態、酸素要求性と生育温度による分類に関してRDF化を行った。
d088鯖江観光LOD鯖江観光LODチーム第3回LODチャレンジデー「オープンデータハッカソンin鯖江」の成果をまとめたものです.
公開されている鯖江の観光関係のLODに相互リンクを追加することで,観光LODとしての価値を高めることを狙いました.
作業内容は, http://goo.gl/cA5xO をご覧ください.
d089ギリシャ神話の相関図Aya_Igarashi複雑なギリシャ神話の相関図を示した。 foaf:knowsは自身の子供に対して関係となっている。 同じ子を持つ親は夫婦であり、子は親を2柱持つ。 また、子の親が1柱であった場合1柱の神から生まれてきていることが分かる。