2008/1/10 XMLコンソーシアムWeb2.0部会 議事録
■日時:2008年1月10日(木), 14:00- 18:00
■場所: メタデータ株式会社 2階 会議室
■参加者:17名
事前の参加案内
アジェンダ
■議事記録:
★c2talk.net APIの紹介(インフォテリア 甲斐さん) (http://www.c2talk.net/event/contents/home/) 資料
c2talk.net公開の背景、サイト説明、API説明、開発者談、Page2008のイベント情報をc2talkに登録を実演等
【説明内容】
・ 2007年11月にリリースした
・ 現在のバージョンは「2.0」はバージョン
・ もともとはクライアントのカレンダーソフトだったが、イベントカレンダが約200種類にもなりカレンダソフト以外から見たいニーズがあった
→ Web上に公開するとともに、イベント情報も付加と合わせてAPIも同時公開した
・ 特徴はHTMLをスクレーピング機能。outlookなどからのスケジュールソフトから抽出可能
→googleカレンダからも取り込み可能
・ イベント検索、イベント投稿、地図(googlemap)、yahooカレンダ、googleカレンダ、ソーシャルブックマークへワンクリックで可能
・ c2talkは非商用目的は無償。商用目的は有償。特にトラフィックが大きくなる機能提供は有償。
・ API機能としては、「イベント追加」、「検索」、「変更」、「削除」、「ウォッチリスト」等
→c2talkAPIドキュメントで検索可能(http://www.c2talk.net/contents/developer/api/11overview)
・ POSTのXML形式で送信する。XMLスキーマは持っていないシンプルな独自XMLフォーマット
→レスポンスはxml、将来的にはjsonも対応予定
・ 利用にはユーザ登録が必要。APIキーで認証を行う
・ 特定のイベント取得やイベントリスト検索にはAPIキーは不要。イベント登録の際にAPIキーが必要
・ 登録しているユーザのみイベント情報を見せる機能もある
・ イメージのアップロードもできる。この場合はbase64エンコードで送信する
・ 2007年12月にぴあ様とタイアップしてc2talkと同じ内容を表示させた
ぴあ様:サイトのデザインを担当
インフォテリア:タグを埋め込むスクリプトを作成した
→ぴあ様にはITプログラマはおらず、デザイナしかいなかったが、短期間で作成することができた。
・イベントカレンダーをいろんなサイトで見ることができればイベントカレンダーの知名度もアップだろう
・現在のところ収益性はあまりない。ビジネスモデルはぴあ様の事例を参考にしていきたい
→ビジネスモデルはCGM(Consumer
Generated Media)がメインか?
・運営ではメルマガを定期的に配信している
・APIを使って面白いサービスをやっていただくとありがたい
・Page2008のイベント情報を実際にc2talkへ登録実演
→ 5分程度で登録可能 (写真他素材への凝り方による)
【質疑応答】
・GoogleMapの地図座標表示の際に、(geocodingを使っての)緯度経度変換はインフォテリア側でやっているのか?(野村さん)
→ はい(甲斐さん)
・Javascriptのソース中にAPIキーが埋め込まれているのか?(荒本さん)
→ はい(甲斐さん)
・公序良俗に反するイベントカレンダーはなかったか?(野村さん)
→ 過去にはない(甲斐さん)
・登録系が入るとAPIキーが露出しているので危険かも(荒本さん)
→ 登録時にHTTPのユーザ認証も含まれる
c2talk以外からイベント登録した例は今のところはない。ただ、新手のスパムになる可能性あるかも(甲斐さん)
・メッセージにXMLスキーマがないのは?(荒本さん)
→ ビジネス系なら必要だと思うが、ユーザライク寄りを重視した。がちがちにつくると、まとまりがなくなってしまうのでなるべくライトに(甲斐さん)
・ユーザ登録時にカテゴリ登録しておくと、カテゴリに関連したイベント登録時にメールや新着通知など行う機能はないのか(白井さん)
→ ウィッシュリストのような機能は今のところはない。基本は見に行くか、RSSタグリーダでも見ることはできる(甲斐さん)
・HTMLスクレーピングの具体例を見せてほしい(小林さん)
→ 例えば、TSUTAYA様のレンタル発売日情報やリストの情報から発売日情報だけをスクレーピングしてc2talkクライアントへ取り込み
ちなみに、各サイト毎で専用のスクレーピングをプログラムしている(甲斐さん)
microformatが欲しくなる(小林さん)
・他のイベントで誰が参加しているのかわかると良いかも
★イベント・カレンダーをXML Consoritumサイトにどうマッシュアップできるか
・XMLコンソーシアムのカレンダは文章ベース。イベントカレンダ形式にできないかな(野村さん)。
・XMLコンソーシアムのサイトは手で書いているのか?手で書いているとmicroformat等は向かないかもしれない(荒本さん)
・例えば、XMLコンソーシアムのイベント情報をc2talkに登録してマッシュアップするとか
★中小規模エンタープライズマッシュアップ開発ツールProjectZeroのRESTfulなアーキテクチャー(IBM 根本さん)(http://www.projectzero.org/wiki/bin/view/)
「Project
Zero」とは?、IBMが「Project Zero」に至った背景、ターゲット、質疑応答等
・Zero
complexity. Zero overhead. Zero obstacles.
・「Project
Zero」のターゲットは、ロングテールモデルの真ん中あたり
・Web2.0ベースの開発とSOAベースの開発の違いを説明
→例: (Web2.0)
(SOA)
少数精鋭 ⇔ 大規模
作った人が動かす ⇔ 作った人がおさめる
個人参加が多く、プレイヤーが多い ⇔ 大企業内の開発者のみ
参照系 ⇔ 更新系
・軽量言語はテキスト処理が得意
・各社の軽量言語戦略(Sun、Microsoft、楽天、IBM、Yahoo、Google)
・スクリプト言語をUSでは「script language」と呼ぶが、日本では「lightweight language」と呼んでいる
・Google
Trendsでは言語の人気度は「Java > php >
c++ > ruby」である。Rubyが思ったほど少ない
・Javaはなぜエンタープライズ言語か?
→ JSR: JCPで仕様策定、個人に依存していない
Reference
Implementation実装例: 使用を満たす参照実装が存在する
Java compability toolkit (検証キット): 厳格なテストスイート、java1.0は今でもサポートされている
・CDCD(Community
Driven Commercial Development)
→ IBMが試みているもの
・Groovy
JSR241 スペックが決まっている
・Java
1.0 のサポート:言語仕様として Java5 でもサポート
・「Groovy」は「Ruby」より開発生産性が高い
・Groovy中にjavaのコードが埋め込み可能、java
-> groovy続けてコーディング可能
・Grails Architecture groovy版のRoR。RoRよりjavaEE色が強い
・Rubyは呼び出しメソッドがUNIXチック、Groovyはjavaチック
・Project zero core
→ json atom等。LINQも使えるみたい
・Ajax toolkit 比較 → @ITに掲載 prototype
jQuery MochiKit….. DOJOがフルスペック持っている
・Enterprise
での
Web 2.0 は Secure で リライアブルが必要
・RESTで作ると、連携がスパゲッティ状になってしまう。参照系はREST。更新系はSOAPか
・トランザクションが確保できるか?
→RubyやPythonは向かない
・ステートが進む世界になるとweb2.0的設計では難しくなるかも
・RESTfulアーキテクチャをIBMでは Web Oriented
Architecture。T.オライリーはResource Oriented Architecture
・Restfulな更新制御 送信時にPOE:1を付与 → 2回目は405コードで返すとか。ただし事例がない
・Project
ZeroはEclipseプラグインで作成。Hello Worldも簡単に作れる。yahoo pipesと似ている
→GroovyをEclipseで動かすのはZeroのフルバージョンをいれる
・Global SOA → web2.0とEnterpriseを結ぶハブとして、またはweb2.0とSOAとの架け橋としての意味が込められている
SOA:WOA/ROA
・Innov8(イノベイト)の話
・IBM Metaverseの話。アパターとかリアル。歩くことに重視してそう
・Second life上 IBMは宣伝程度で次のステップは今のところ動きはない
・クラウドコンピューティングはブラウザベースの開発になるかもしれない
・「Project Zero」系でつくったもの → Lotus製品(Notesとか)に組み込まれる予定
・NotesのSameTime、通話機能(Sametime Connect) がある セキュア。Skypeと比較すると安全
QED Wiki
Luana mashup editor
Nova Services
・AlphaWorks では制約ないが、製品化の時にはIBM統一ガイドライン(usability,
accessibility他)が考慮される
【質疑応答】
・「Project Zero」のライセンス体系って微妙な体系になってませんか?製品版になったときにどういうライセンスになる?(玉川さん)
→今のところはどうなるか分からない(根本さん)
・かなりの数のエンジニアがZeroに関与しているが、IBMのSOAにどう当てはめていくのか、分からない(根本さん)
・Web2.0的開発は基幹システムでは難しいのでは。Railsでつくって3年後だれがメンテするのか(宮崎さん)
→やはりコードだけではNGでしょう(根本さん)
★ 社内コラボレーション支援への要求仕様、特にマッシュアップの有効性を議論 →新コンソーシアムサイトの議論に吸収
★ 新XMLコンソーシアムサイトでのクライアント側マッシュアップや画面イメージ、APIやXMLDBへの要求仕様
・XML
DB部会12/20の議事録から、背景・経緯の説明。
・XML
DB 部会:DB設計。(サーバサイドでのマッシュアップ。)検索機能等。
・Webサービス実証部会ではAPIを作成。 加えて、既存Webコンテンツのスクレーピングを今回、分担仮依頼。
・Web2.0部会ではUI設計とマッシュアップ利用のアイディア
※以下宮崎さん記録:
■基本UIデザイン案(2ページ分):
http://www.xmlconsortium.org/index.html
の右上に今月と来月のカレンダー。小さな日付箱を色分け表示+1、2文字?
http://www.xmlconsortium.org/seminar07/index07.html (セミナーTop)
ここにはタグクラウドなど、JavaScriptの置いて良い。
http://web.archive.org/web/20030202002547/http://www.xmlconsortium.org/
の頃からサイトはあまり変わっていない。
ここを使って、歴代Top画面のサムネール作ってTimeline表示をわかりやすくniceな画面にできるか。
参考?団体のサイト:
http://www.xml.org/
http://www.oasis-open.org/home/index.php
→topは4カラム。オーソドックスな検索窓。
機能案
・RSS/ATOM
・全文検索機能
・PDFからテキスト抽出・登録し/タグ付け
文書をどうみせるか?
API
比較サービスの出力イメージも一つの案でしょう
・XMLコンソーシアムのサイトを見に来る人は何を期待しているのか?
ソーシャル系
・FaceBook API が programmableweb
の
API of the Year を取得
http://blog.programmableweb.com/2007/12/27/api-of-the-year-facebook-platform/
たくさんのマッシュアップアプリが作られた
オープン・クローズド
アプリの売買も成立
・Web
クラスタリング
同様なサービスの API の共通化
・アクセス数 何人かでアクセスキーをシェアする
・サムネイル化サービスでも遅いものでは数日かかる
・実際にやってみないとわからないことも多い
例:極小サイズまでいけるのはこれ:
http://thumbs.bookmacro.com/w/15/h/15/u/http://d.hatena.ne.jp/
サイトの参照者は何を見に来るのか?
・セミナー情報の検索・参照
・事実/意見の区分?
・カレンダーでセミナー日程
・タイムライン 縦軸は分類・フェーズ
cf http://gethapp.com/yama/authr/
プロットは自動化したい
その準備のためにセミナー概要頁をスクレイピングしてメタデータ抽出:
http://www.xmlconsortium.org/seminar07/071204/071204-prog.html
縦軸はタグにする?ユーザによって見方を変えることができるように
キーワード抽出の API その重みづけなども自動化可能
http://www.api-match.com/ へ「キーワード抽出」と入力。
・セミナー情報のサマリー情報からのスクレイピングは実証部会
・会員企業向けの資料の古いものは一般公開する?
・文書の連携
・国会図書館など外部との連携
・c2talk
ではタイムラインはできない
Web
版ではスクレイピングでの登録はできない
カレンダ情報の自動登録のための拡張
・新旧文書の比較
・イベント情報の議論はしてない
・他のサイトにマスタデータをおくのはどうか?
コピーを宣伝のためにおくのは OK でしょう...
・BizPal で活動情報の交換
イーストさんで HP もホスティング?
その場合の部会「グループ」のイメージ:
http://bizpal.jp/bmkm/Blog
・カテゴライズ
・検索結果の鮮度を合わせて表示する
・つっこんだキーワードでの検索が多いでしょうから、マッチングは難しくないでしょう
タグクラウド生成のAPI:
http://clouds.zoomblog.com/archivo/2006/02/27/zoomclouds-Api.html
・形態素解析
Yahoo
テキスト解析
http://developer.yahoo.co.jp/jlp/MAService/V1/parse.html
・外部サービスに依存してもいいのか?
運営委員会で要確認
おそらく会員企業提供のものは OK だろう
・検索結果から関連のものがみれるとうれしい
関連をみるためにタグクラウドは使えないか?
検索順位は高いけど古い場合に、より新しい情報が関連として見れると便利
TX1
の方も気にされている
・ユーザコメントを付ける機能
誰が登録できて誰がみれるか?
・タグのリストをあらかじめ登録しておく
・リニューアルの目的は?
会員の活動をしやすくする
今のホームページは Web 0.5 なのでどうにかする
・評判検索
炎上しそうな情報をあらかじめチェック
・セミナー情報ページに
タグクラウドとタイムラインを設置?
・検索結果にトップページのサムネイルを表示する
igWebCap では PDF はサムネイル化できない模様
PDF
をサムネイル化するツール:会員企業の提供するオンラインのもの → オフライン
・人、もの、事、時間、場所などいろいろな切り口の検索
・特に人や会社に焦点があたると、問題があるかも?
検索結果のみに表示?
・メーリングリストの公開には意味がない?
・部会間の情報のやりとりは?
・議事録は?
部会ごとに異なる。Web 2.0部会が一番ちゃんと書いてそう...
そのほか
・Web
2.0 提言書の続き http://www.xmlconsortium.org/wg/web2.0/teigensho/index.html
・野村さん BLOG で Ruby 1.9、Ruby on Rails 2.0 ネタがある
http://d.hatena.ne.jp/nomuran7/20071228
http://d.hatena.ne.jp/nomuran7/20071231
http://d.hatena.ne.jp/nomuran7/20071211
・Ruby
on Rails 2.0 では、REST サポートを
ActiveResource
・authr サイト → タイムラインのサンプル
・c2talk
の過去データをどう活用するか?
・タグクラウドは2000個を超えると実用にならないといわれている
※以下、荒本さんメモ(内容は重複しますが理由を問う表現が貴重なのでほぼそのまま採録):
・スケジュール情報をもっと便利に&みんなに見てもらいたい
c2talkに登録すれば、露出があがるのでは?
外部のサービスに依存するのはどうなの?
宣伝目的ではなく運用のコアにすると、サービスが無くなると困る
会員企業のサービスを使うのは良いのではないか?
運営委員会で要確認
・サイト内で検索をしたい
既存のPDF資料をどう検索するか?
テキスト抽出して、XML化
タグクラウドを生成できないか?
そおいうサービスはあるが、会員企業のものではない
運営委員会で要確認
検索結果で、該当するPDFのそのページだけでも見たい
会員企業でなくても、そのページだけ見れると便利
PDFを画像化できないか?
・情報の整理
技術の変革、活動の内容をタイムラインで見せれないか?
・既存のWebコンテンツの利用
既存コンテンツをスクレイピングできないか?
作るとしたら、Webサービス実証部会の出番
・その他のコンテンツの利用
メールでのやり取り
XMLコンソーシアムのMLに流れたのは、リーダーからのお知らせがほとんど
これはRDB上に残っている
個別の議論は、Yahooグループなどを利用して行われたので、保存されていない
部会議事録
議事録を一か所に集めている部会がほとんどない
・SNSのような機能
YahooグループやGoogleグループでやっているような事が、コンソーシアムのサイトでしたい
・コメント機能
サイトやセミナーの内容について、コメント機能を付けたらどうか?
間違いの指摘や、意見、要望を聞くことができる
誹謗、中傷で、あらされる危険がある→削除権は誰が持つ?
無理っぽい
★その他、フィード等の要素技術、アプリケーション、エンタープライズでの活用事例など
→ skip
【書籍紹介】
ウェブを変える10の破壊的トレンド 渡辺弘美
ソフトバンククリエイティブ (2007/12/22)
-----------------
★★ 次回について
XMLDB部会、Webサービス実証部会との合同部会
日程:2月6日(水)13:00-16:30
場所:池袋・サンシャイン国際文化会館709号室
議題候補:
★ 新XMLコンソーシアムサイトでのクライアント側マッシュアップや画面イメージ、APIやXMLDBへの要求仕様 のアイディア出し。
・XML DB 部会:DB設計。検索機能等。
・Webサービス実証部会ではAPIを作成。
・Web2.0部会ではUI設計とマッシュアップ利用のアイディア。
★特記事項
・JAGATさんのPAGE2008ジョイントイベントのため、公開討論の形をとります。
ただし、外部からの集客はしません。
他の会場では、各グループ内の懇親会も多く開催されるため遠慮がちに内輪の議論する必要もありません。
堂々と、上記テーマの進捗を確保すればOKです。
-----------------------------------------------------------------
■参加者:17名
以 上