12月6日~7日の2日間に渡って開催された「第2回Linked Open Dataハッカソン関西 in 大阪(第7回LODチャレンジデー×第3回オープンデータとソーシャルデザイン研究会)」にイベント参加レポートを寄稿いただきました。
なお当日の発表資料および、ハッカソンの成果(の一部)をまとめたものは、こちらにてご覧いただけます。
-----------------------------------
2013年10月19日の第1回Linked Open Dataハッカソン関西 in 大阪から約1ヶ月半、第2回目となるLinked Open Dataハッカソン関西 in 大阪が12月6日~7日の2日間の日程で行われました。1日目は前回と同じ、グランフロント大阪にある大阪イノベーションハブに於いて、LODに関する講演、LODを活用するための技術紹介などが行われました。
技術紹介の中で特に私が興味を持ったものが2点ありました。
1点目は、LODを活用して作成されたアプリのデータソースを差し換えて新しいアプリケーションを作成してしまうという、「逆マッシュアップ」の考え方です。
行政がデータをオープンにしてもそれを活用したアプリを作るのは手間もかかりますし、プログラムを書ける人でなければなかなかハードルも高いものですが、アプリはそのまま再利用しながら、データの差し換えで新しいアプリを作れるのであれば、データの公開後すぐにアプリを作成でき、また作成そのもののハードルも低くなります。
もちろんアプリ側でデータの差し換えに対応しておく必要がありますが、工夫次第で元のアプリとは全く別の用途のアプリを作成することもできますし、データ形式が統一されるオープンデータならではの考え方だと感じました。
2点目はR言語を用いたオープンデータの可視化です。
R言語は統計処理に特化したスクリプト言語であり、データを扱うのが得意であるため、極めて少ない記述で簡単にグラフ等を作成することができるということで、手軽にオープンデータを可視化できそうという印象で、自分も何か作ってみたい!と大変興味を持ちました。
2日目は大阪大学産業科学研究所に会場を移し、丸一日かけて、実際に手を動かしてアプリを作ってみるというハッカソンが行われました。
午前中はLOD技術を利用した開発、R言語を使ったオープンデータの可視化についてのチュートリアルが行われました。また、午後からのハッカソンで開発を行うテーマについての発表があり、当日、参加者から発表のあったテーマも加えてグループ分けを行いました。
テーマはSPARQL Timelinerを使ったアプリ開発、R言語を使ったオープンデータの可視化、といったアプリ開発から、大阪市の統計データのRDF化といったものまで様々なものがあり、技術者でなくても参加可能なプログラムになっていました。お昼休みを挟んで午後からはいよいよ実際の開発作業に入ります。
私は前日興味を持った、R言語を使ってオープンデータを可視化するグループに参加しました。
特に温めていたアイデアはなかったのですが、漠然と年齢別人口の地域ごとの偏りを地図にマッピングして見られたら面白いかな?と思いつき、大阪市が公開しているデータで使えそうなものを探してみました。
すると、年齢別推計人口のデータが平成18年~平成25年分まで公開されていたので、これを使うことにしました。
また、地図上のそれぞれの区の上に、人口の棒グラフを表示するようなことがR言語できないかということを検討しましたが、簡単にはできそうになかったため断念し、別のものを作ることにしました。
最終的に、Googleが提供しているRのパッケージで、時系列ごとのデータの移り変わりを表現することができる、モーショングラフというものがあるということを教えていただき、それを使って年代別・区別の男女比のモーショングラフを作りました。
いざ作り始めてみると、初めて触る言語でアプリケーションを限られた時間の中で作るというのはなかなか難しく、結局はR言語のエキスパートの方に大半を作っていただきました。
それでもなんとか一日で目に見えるものが出来たので、かなりの達成感がありました。
今回、R言語でオープンになっているデータを可視化するにあたって、データをRDF化せず、提供されているExcel形式のまま、アプリケーションに取り込みました。
そこで感じたことは、Excel形式のデータではやはりフリーフォーマットに近いのでそのままでは使いづらい、ということと、逆に、オープンデータを使ったアプリケーションだからといって、必ずしもRDF形式のデータにこだわる必要はない、ということです。
逆説的ですがRDF形式になっていなくてもとりあえずオープンになっているデータを活用して何かを作ってみることで、公開されているデータの意義を理解したり、データ活用の新しいアイデアが浮かぶきっかけになるのではないかと思いました。
夕方5時ごろまでそれぞれのグループで開発作業を行い、そこからグループごとに成果発表を行いました。
Youtubeにアップされている大阪の観光スポットの映像を地図上にマッピングしたアプリや、SPARQL Timelinerで大阪の橋を可視化したアプリ、SPARQL Timeliner用のクエリを生成するWebアプリなどたくさんの成果が発表されました。タイムオーバーで完成には至らなかった方もそれぞれ参加された感想を発表されていました。
一日でこれだけの成果が生まれるLODハッカソンの盛り上がりと、これからたくさんのデータとアプリケーションが生まれるであろうオープンデータの世界に非常に可能性を感じられた二日間になりました。
株式会社スマートバリュー
公共クラウドディビジョン 開発・デザイングループ
田重田 勝一郎
-----------------------------------
データ分析に興味を持っており、「第2回Linked Open Dataハッカソン関西 in 大阪」に参加しました。元々自分の研究でもデータ分析に関わっており、普段はwekaというツールを使っています。以前からRとSPARQLにも興味を持っており、今回両方とも勉強及び使うチャンスをいただき、本当に良かったと思いました。朝の時間はデータ分析ツールの使い方の紹介で、午後からLOD技術を使って、実際のプログラムを開発するという丸一日のイベントでした。複数のエキスパートの方がいらしたので、開発をスムーズに進行できました。そして大量のデータを使って何を作るのかも重要でした。最後の成果発表もみんなのアイデアを共有するよい機会であり、非常に内容が充実したイベントだと思いました。経験者はもちろん、データに興味があれば、自分がデータに関して興味のあることをこのイベントを通じて知ることができるので、特に学生たちにお勧めしたいイベントです。
大阪大学
孔 全
-----------------------------------
大阪大学の産業科学研究所で行われた第2回 Linked Open Data ハッカソン関西に参加しました!
僕はLODについて、名前は聞いたことがあったのですが、実際にどうやってデータが生まれるのか、どうやってアプリケーションが生まれるのかといったプロセスについては全く知りませんでした。
今回のハッカソンでは、データを作成するグループ、アプリケーションを作成するグループ、既存のアプリケーションを改良するグループに分かれて、最後に各グループの成果を発表したことで、データの作成から実際にアプリケーションとして公開されるまでのプロセスを丸ごと知ることが出来ました。
僕はRという言語を初めて使い、データの表示を行おうとしたのですが、構造化されていない excelデータの読み込みに苦戦して、中々思ったように開発が進みませんでした。読み取ろうとした excelデータは政府が公開しているものなのですが、jsonやxmlといった機械が読み取りやすい形式ではなかったため、まずは機械が読み取れるデータ形式に変換しなければなりませんでした。
数時間ほど悪戦苦闘を続けていて、人間が読み取りやすいデータ形式はもちろん重要なのですが、機械が読み取りやすい形式も同じように(あるいはそれ以上に)重要だということが身に染みました。また、機械が読み取りやすいデータ形式に変換して下さっている方々の努力に感謝した次第です(笑)。
グループのお役に立つことがあまり出来なかったのですが、今回のハッカソンで、データの作り方、共有方法や簡単な表示方法を学ぶことが出来たので、この経験を活かして、次こそは面白いアプリケーションを皆さんにお見せできるようにしたいです!
企画して下さった運営の方々や、手取り足取り教えて下さった参加者の皆さん、ありがとうございました!大阪大学工学部 電子情報工学科
情報通信工学科目 情報システムコース
4回生 増田 彬