1. じんぶん堂TOP
  2. 自然・科学
  3. ビッグデータ時代における「情報」の知と人文知 紀伊國屋書店員さんおすすめの本

ビッグデータ時代における「情報」の知と人文知 紀伊國屋書店員さんおすすめの本

記事:じんぶん堂企画室

円グラフ、線グラフ、棒グラフなどデータグラフィックスの近代的形式の発展は、ウィリアム・プレイフェア(1759~1823)によるところが大きい(「データ視覚化の人類史」より)
円グラフ、線グラフ、棒グラフなどデータグラフィックスの近代的形式の発展は、ウィリアム・プレイフェア(1759~1823)によるところが大きい(「データ視覚化の人類史」より)

情報論の見取り図

 まずはルチアーノ・フロリディ『情報の哲学のために データから情報倫理まで』(勁草書房・2021年5月)です。

 原書は、オックスフォード大学出版局の著名シリーズVery Short Introductionsから、シンプルにInformation: A Very Short Introductionというタイトルで出ていました。ひとくちに「情報」といっても、いくつもの学問分野にかかわり、一冊でその知の見取り図を示すという作業は想像以上に困難を極めるはずですが、哲学者として学際的な議論をリードしてきた著者は、それをやってのけました。

 本書は、「データ」「情報」「知識」は何が違うのかという概念的な整理から、数学・論理学・哲学・倫理学・言語学・工学・生物学・経済学などの分野によって異なる情報の見方、そして、人間だけではない(動物や自然環境や人工物を含む)あらゆる存在がかかわる「情報圏」の倫理という壮大な構想まで、圧縮された内容の中に深い議論への入口をそこここに用意してくれています。中でも、あらゆる「情報理論」の祖として今でも影響力あるシャノンの「通信の数学的理論」(MTC)は機械的に処理するデータの伝送効率性に関するもので、情報の意味論的内容や有益性を捉えるには不十分という指摘が重要で、西垣通『新 基礎情報学 機械をこえる生命』(NTT出版・2021年6月)とも響き合う議論です。

統計学はデータ視覚化とともに

 近年「データサイエンス」が文理を越えて大ブームとなっている中で、データの収集や分析だけではなく「可視化」「視覚化」(visualization)も、数字だけでは見えない現実に潜むパターンを発見させてくれる手段、最終的な意思決定に向けてのプレゼンの成否を分ける大事なステップとして注目され、関連書籍があふれています。

 では最近の話かというと、統計グラフィックスの大家たちがまとめた『データ視覚化の人類史 グラフの発明から時間と空間の可視化まで』(青土社・2021年11月)を読むと、棒グラフや散布図といった今日の私たちがよく目にするグラフ形式の大半が、18世紀や19世紀には生まれていたというのですから、驚きです。本書は、この分野の歴史を再発見する「マイルストーンプロジェクト」から得られた洞察を主題別にまとめたもので、コンパクトな判型ながら全10章は読み応えがあります。

 今日の「データサイエンティスト」の前身に当たる初期の統計学者たちは、国家・社会・経済にかかわる計量的データの提示をこととする中で、数々のデータ視覚化のイノベーションを成し遂げました。それはしばしば、クリミア戦争で兵士の死因の異常に気づき鮮烈な鶏頭図に示したナイチンゲールのように、具体的な必要に応じて政策的な意思決定に働きかける、現場的な性格の強い知でした。19世紀半ばのコレラの世界的流行から「統計グラフの言語における新しい発明」が生まれた一方、統計学と病理学のエビデンスをめぐる立場の違いが感染症対策を左右したエピソードは、どこか今日の新型コロナをめぐる状況を思わせるものがあります。

 人間的な認知の面も重要です。コンピュータによるデータ処理が飛躍的に高速・大規模・複雑化した今日でも、たいていの人間は認知的限界から多変量データをそのまま理解するわけにはいきません。二次元の図表で視覚化できることを突き詰めた先人たちの知恵が見直されているのは、どこか人間として励まされるものがあります。

言語情報と数理・統計的な知

 最後に、さらに読み応えのある本ですが、田中久美子『言語とフラクタル 使用の集積の中にある偶然と必然』(東京大学出版会・2021年5月)に触れておきましょう。

 サントリー学芸賞を受賞した名著『記号と再帰 記号論の形式・プログラムの必然』(東京大学出版会・2010年・新装版2017年)の著者による待望の続編として注目された方も多いでしょう(本書も2021年の毎日出版文化賞を受賞しました)。まさに文理の境界を越える構えの大きさに感銘を受ける仕事で、居ずまいを正して読みたくなります。言語情報と数理・統計的な知はどうかかわるのかを考えさせられる本になっています。

 メルヴィル『白鯨』のような文学作品でも、その文字列をランダムにサンプリングした「白鯨モンキー列」でも、その他のどんなジャンルの文書(新聞など)でも、例外なく成り立つ「統計的言語普遍」があるとは、一体どういうことなのでしょうか。語や文を人が解釈することを前提としてきた言語学に対して、言語というものを外側から大域的に(意味をいったん捨象して)ビッグデータとして、あるいはシステムとして分析することで、いったい何が見えてくるのでしょうか。

 本書は、記号全般を貫く冪乗則(単語の使用頻度で有名な「Zipf則」など)が言語においても成り立つことを、使用データの大規模な集積(コーパス)を計算論的に解析することで示していきます。「nグラム」や「深層学習」による工学的な「言語モデル」を駆使しつつ、複雑系としての言語が織りなす無限にも見える自己相似的な構造(書名の「フラクタル」に当たる)とその人間的な有限性が意味するものに迫る、その先に得られた知見と人文系の思想を対話させる最終部が、プログラム言語の彼方に異彩の人文的風景を見せてくれた『記号と再帰』の読者お待ちかねの内容といえます。数理・統計的な内容の負荷が文系読者には若干高めですが、分野を越えて言語と情報に関心ある人にはぜひチャレンジしてみて欲しい本です。

AI時代の人文知

 今回は、どちらかというと理系的、数理・統計的な成分の強い「情報」の知から、「人文」的な学びを取り出せそうな三冊を読んでみました。何でもAIにゆだねがちな時代に人間のエイジェンシーをどう考えるか、まさに人文知の真価が問われているところだと思いますが、その中でも導きになる仕事に光を当てることができていたなら幸いです。

ページトップに戻る

じんぶん堂は、「人文書」の魅力を伝える
出版社と朝日新聞社の共同プロジェクトです。
「じんぶん堂」とは 加盟社一覧へ