文系の社会科学者にとっての福音、なのかも

手元にあるデータを教科書にある数式に片っぱしからブチ込み、何らかの規則性を示す結果が出たらそれを解釈すればいい…、というのは文科系の素地を持つ社会科学の学生が一度は考え、そして挫折するアイデアではないかと思う。数学的素養が薄いにもかかわらず、というか、それを逆手にとって何か面白いことをやってやろうと考えるわけだ。だが、それは大抵失敗する。

なぜ駄目なのかと言えば、ほとんどの分析手法は特定の領域から集められたデータを特定の問題関心に基いて分析するように設計されているからだ。理論と先行研究、そして対象についての入念なスタディがなければ正しい分析結果にたどりつくことはできない。

それは全くもって正当なことではあるのだが、同時に独創的な見解の敷居を非常に高くしてしまうものであることも確かだ。色々なことにちゃんと習熟した後でなければ常識外れの視点からの結果を出すことはできない。何というか、それはちょっと矛盾した状況で、「腐敗したシステムの中で成功者にならなければ、改革を行なうことはできない」という某国の政治状況とちょと似ている…ような気もする。

で、この話。「「物理法則を自力で発見」した人工知能」。こいつはその「力任せ分析」を現実のものにしてくれるシステムなのかもしれない。記事によると、要点はこういう感じらしい。

Lipson氏とSchmidt氏が開発したプログラムは、与えられたデータセット内の互いに関連しあった要素を特定し、その関係性を記述した等式を生成するというものだ。プログラムに与えるデータセットには、バネにつながれた振動子や単振り子、二重振り子といった単純な力学系の運動を記述したものを用いた。いずれも、学生に物理の法則を教える際によく用いられる力学系だ。

データセットを与えられたプログラムは、まず基本的な演算処理――足し算、引き算、掛け算、割り算と、いくつかの代数演算子――をほぼランダムに組み合わせることから開始した。

最初のうち、プログラムが生成する等式はデータをうまく説明できていなかったが、一部の等式は他に比べてわずかに誤りが少なかった。プログラムは遺伝的アルゴリズムを使い、最も誤りの少ない等式を修正し、それらを再びテストして、中でも優れたものを選び出し、再び同じプロセスを繰り返して、最終的にその力学系を記述する一連の等式を導き出した。その結果、いくつかの等式は非常に見覚えのあるものになった――運動量保存の法則と、ニュートンによる運動の第2法則を表わしたものだ。

これは有望な感じがする。デュルケームが持っていたら、カトリック信仰や家族人員、業種と自殺率との相関をあっという間に指摘して、自殺論を10年早く完成させていただろう。
ただし、その結果を「社会的凝集性」という概念に結びつけるのは人間の仕事だし、データと対話しながら作業してくプロセスが失なわれることで何が起きるのかはわからないが…。

もうひとつ、発生しうる問題は、データの整形と欠損処理の関係だろう。分析に適さないケースの除去、連続変数のリコード…、というような手順が自動化されることはありそうにないし、必ず人間による判断がからむことになる。まあ、それすらなくなってしまったらまずいような気もするのだけど。