5'-TTAGGG-3'

Suis-je ce que mon passé a fait de moi ?

pivot_table について

久しぶりの更新です。
きっかけは覚えていないのですが、夏季休業中にふと Systems Biology の勉強をしようと決意しまして、最近はもっぱら Systems Biology を勉強しています。それに加えて Python や僕の本業の腫瘍学を勉強しています。有機化学も復習しようと思っていたのですが、少しきついなと思ったので、秋学期の後半にまとめてやろうかな考えています。

Systems Biology についてですが、普段からよくチェックしている MIT の OCW に良い感じのセットがあったので、それに沿って勉強しています。まだミクロなスケールについて勉強している途中ですが、僕の興味はマクロなスケールよりもミクロなスケールの方に向いているので、ミクロなスケールの内容を終えたら Systems Biology の勉強は一度中断する予定です。余談ですが、日本語で書かれた教科書としては Uri Alon の「システム生物学入門」が一番良く知られていると思います。

ocw.mit.edu

システム生物学入門 -生物回路の設計原理-

システム生物学入門 -生物回路の設計原理-

また、Poincaré-Berdixson の定理などの非線形分野の知識もところどころ要求されるため、Ch.7 までですがストロガッツも読みました。

ストロガッツ 非線形ダイナミクスとカオス

ストロガッツ 非線形ダイナミクスとカオス

ミクロなスケールにおける Systems Biology に関しては、一通り勉強して自分の言葉に咀嚼してからまとめようと思ってます(不慣れな単語や概念が多いので少し苦労しています)。

話が逸れました、Python に関してです。
同期の友人からバイオインフォマティクス向けの Python に関する情報を教えてもらったことがきっかけで Python の勉強をスタートしました。先ほど触れた MIT の OCW にある Systems Biology のコースにしても、そのほかいろいろな場所においても "Python" という単語を前々から目にする機会は多かったので、良い機会だと思い勉強することにしました。教科書としては、Wes Mckinnney の 「Python によるデータ分析入門ー Numpy、pandas を使ったデータ処理」を使っています。この教科書は Python 2 系統を採用しているのですが、僕は Python 3.4 を使用しているので、時々コードをそのまま入力してもエラーを吐き出されることがあります。そのような場合に僕が見つけた対処法などをメモしておこうかなと思ってます。まだ初心者ですので、アドバイスや間違っているぞなどの指摘は大歓迎です。

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理

さて、ここからが本題です。p30 の中段において、ある映画についての性別・年齢ごとの平均評価を出す際に data 表に対して pivot_table を使用する旨が書いてあり、教科書ではそれを実行するために

mean_ratings = data.pivot_table('rating', rows='title', cols='gender', aggfunc='mean')

というコードが記載されています。ところが、僕の環境でこのコードを実行するとエラーを吐き出されてしまいます。そこでいろいろ調べたところ、どうやら rows や cols などが Python 3.4 ではダメらしく、

mean_ratings = data.pivot_table('rating', index=['title'], columns=['gender'], aggfunc='mean')

とすることでエラーを吐き出されなくなりました。rows → index はまだしも cols → columns という変更が僕にはイマイチよくわからないのですがね。まあ仕方ないですね。