« 雨模様の日には雨モヨウが似合う。 | トップページ | 水筒男子の水筒バッグの四方山話 »

2011年8月20日 (土)

導火線読書:本のDNA解析はこれからだな。

読書とは導火線である。ひとつの本から別の本への招待状とでもいおうか。知りたいことへの深まりと新しい出会いが楽しい。ぼくの例をひとつ。



デザインの輪郭』(深澤直人)から『俳句への道』(高浜虚子)へ。前者には工業デザイナー深澤の発想の原点、デザインのアプローチ、表現ウンチクが詰まっている。その原点は高浜虚子の説く“客観写生”にあった。これを知って客観写生は、ぼくにとっても文章表現の上で拠り所になった。いや寄りかかったままで、いつもズレ落ちそうだけど。

そんな読書の出会いを、全文検索の技術を使って、“本のDNA解析”をする試みがある。

解析された「本のDNA」は、言葉のモーション・密度・ペースなど5つの要素が棒グラフによって表示される。また「ストーリーDNA」として「苦痛と恐怖/ ネガティブ感情」に「サイエンス/テクノロジー/天文学」や「人生/死/スピリチュアル/運命」など、無数にある主題要素のうち10〜20 ほどが抽出され、それぞれがどれほど含まれているかも、棒グラフによって一目瞭然となっている。引用元=slashdot.jp



アイダホ大学の学生Aaron Stantonさんによって2003年に始まった“Book Genome/ブックゲノム”は、次第に他大学生が参画するプロジェクトになり、遂に2011年8月16日より『BookLamp.org』としてレコメンドサービスを開始した。著作者か著作かどちらかを入力すると、本を分解分析して、似たもの探しをしてくれる。



試しに『The Street Lawyer』、John Grishamの法律スリラーを入力してみた(英語本のみ対応)。すると結果はずら〜りとグリシャムの著作が出現した。そんなの当たり前じゃないか!同じ著者の著作をわざわざ挙げなくても、誰でもわかっちょるわい。



ベースとなる「5つの要素」について、スラドの翻訳はかなりテキトーなので、推定も入れて補足したい。

Motion:言語学的には移動表現。移動表現動詞の出現頻度や場面転換の多さ/少なさだろう。
Density:語彙密度=代名詞・名詞・動詞・形容詞など語の密集度。こちらに詳しい
Pacing:スピード、トーン、調子、みたいなもの。
Dialog:対話/会話文の多さ/少なさ。
Description:描写の多さ/少なさ。

Story DNAは主題要素の単語出現頻度だろう。検索では、彼の著作に挟まれて、Michael BaronやJeffery Deaverら別の作家の著作が現れた。ムダではなかった。しかしぼくらはどんな書籍情報が欲しいのだろう?

グリシャムと似たもの探しがしたいとすれば;
法律モノ/警察モノの中で、グリシャムの品質に匹敵する読み物が探したい。

グリシャムに飽きたとすれば;
法律モノ/警察モノに限らず、彼のプロットに似た読み物が探したい。

「似たもの」とは文体でもなく文章でもなく単語でもなく、「クォリティ」なのではないか。それは全文検索だけでは分からず、人工知能が要るだろう。研究を重ねればだんだんと近づいていくのだろうが、現状はまだまだだな。

ぼくが欲しいのは「導火線検索」。その本の中心的な考え方・主張・表現・楽しさなどが、別の角度から語られ、読み進んでゆくことで深まる。そんな導火線読書をリードしてくれること。サーチエンジンより導火線本の著者に訊いた方が良さそうだ。

|

« 雨模様の日には雨モヨウが似合う。 | トップページ | 水筒男子の水筒バッグの四方山話 »

コメント

コメントを書く



(ウェブ上には掲載しません)


コメントは記事投稿者が公開するまで表示されません。



トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/158074/41293668

この記事へのトラックバック一覧です: 導火線読書:本のDNA解析はこれからだな。:

« 雨模様の日には雨モヨウが似合う。 | トップページ | 水筒男子の水筒バッグの四方山話 »