進化学実習 2022 牧野研
概要
-
講師: 岩嵜航 (東北大学 生命科学研究科 進化ゲノミクス分野 牧野研)
-
科目: 東北大学 理学部生物学科 進化学実習
-
日程: 2022年4月11, 12, 13, 14, 18日
-
場所: 東北大学 / zoom.us
-
概要:
理学部生物学科における研究とは、大雑把に言うと 「生物に関するデータを集め、その背後にある理(ことわり)を読み解くこと」です。 そのため、データの解析と作図はどんな研究をするにもほぼ不可欠となります。 正しい結論を導くためには、データをいろいろな角度から可視化して全体の構造を見渡すことが特に重要です。 また、観察・実験・データベースなどから得られるデータは多種多様であり、 そのまますぐ使えることはめったにありません。 まずデータを整形するところから始める必要があります。 この前処理にせよ、作図にせよ、 「エクセルであれをあっちにコピペして、メニューからあれを選択して…」 といった手作業でやるのは大変ですし、再現性が無いため科学の手続きとしても問題です。 いつでもだれでも再検証したり使いまわしたりできるように、 規則性のある退屈な仕事は機械に任せるのが得策です。 本実習では、近年さらに易しくなったR言語を用いることで、 生データから効果的な作図まで簡単に辿り着けるということを体験してもらいます。 -
到達目標: 生物学研究におけるデータ解釈・解析の重要性を認識する。 Rを使用してデータの前処理・可視化ができるようになる。
-
授業計画
- 導入: データ解析の全体像。Rを使うメリット。Rの基本。
- データの可視化
- データ構造の処理1: 抽出、集約など。
- データ構造の処理2: 結合、変形など。
- データ内容の処理: 数値、文字列、日時など。
- 統計モデリング1: 確率分布、尤度
- 統計モデリング2: 一般化線形モデル
- データ解釈の基礎知識、レポート作成方法
- 実践・発表
時間 4/11 Mon 4/12 Tue 4/13 Wed 4/14 Thu 4/18 Mon 13:00 導入 課題解答 課題解答 課題解答 グループ作業 14:30 可視化 構造処理1 内容処理 モデリング2 発表会 16:00 予備 構造処理2 モデリング1 データ解釈 発表会 -
準備学習等
- ファイル、フォルダ、クリックなど一般的なパソコンの基礎知識と経験
-
教科書
- なし
-
参考書
実習環境の設定
途中まででもいいので、できるかぎり実習前に済ませてもらえると助かります。
参考: R初心者の館 by das_Kinoさん, 矢内勇生さん
-
手元のコンピューターの ユーザー名(ホームフォルダの名前) を確認。 半角アルファベットじゃない文字(日本語とか記号とか空白とか)が含まれている場合、不具合の原因になりがちです。 たぶん変更できない?ので新しいユーザーを作って引っ越すのがいいと思います。 半角アルファベット小文字のみで短いものを推奨。
- ✅ Good:
watal
,tamakino
- ❌ Bad:
岩嵜航
,Watal Iwasaki
,heavy.watal
- ✅ Good:
-
OSのソフトウェア・アップデートをすべて適用して再起動。
-
OSの設定で、ファイル名の末尾の拡張子(
.pdf
とか.png
とか)を常時表示する。 -
Windowsの場合、 矢内勇生さん の情報を参照しつつOneDrive問題に対処する。
-
https://cran.r-project.org/ から最新版の R本体(≥4.1.3) をダウンロードしてインストール。 既にインストールしてある場合はバージョンを確認。
-
https://rstudio.com/products/rstudio/download/#download から最新版の RStudio(≥2022.02.1) をダウンロードしてインストール。 既にインストールしてある場合はバージョンを確認。
-
Windowsの場合、念のため Rtools をインストール。次のページに従って設定:
https://cran.r-project.org/bin/windows/Rtools/Macの場合、念のため次のソフトウェアをインストール:
- Command Line Tools:
xcode-select --install
(Xcode本体は不要) - XQuartz: 手動ダウンロード or
brew install xquartz
- Command Line Tools:
-
RStudioを起動し、左側のConsoleで
install.packages("tidyverse", type = "binary")
を実行。 何か訊かれたらyes
と回答。 パッケージがたくさんインストールされます。 -
Consoleに
update.packages(type = "binary")
と打ち込んで全パッケージ更新。 -
Consoleに
library(tidyverse)
と打ち込んでパッケージを読み込み、 以下のようなメッセージと共に読み込まれるのを確認:> library(tidyverse) ── Attaching packages ───────────────────────────── tidyverse 1.3.1 ── ✔ ggplot2 3.3.5 ✔ purrr 0.3.4 ✔ tibble 3.1.6 ✔ dplyr 1.0.7 ✔ tidyr 1.2.0 ✔ stringr 1.4.0 ✔ readr 2.1.2 ✔ forcats 0.5.1 ── Conflicts ──────────────────────────────── tidyverse_conflicts() ── ✖ dplyr::filter() masks stats::filter() ✖ dplyr::lag() masks stats::lag()
講義資料
←→キーで戻る・進むスライド形式。
- 2022-04-11 13:00 | 導入: データ解析の全体像。Rを使うメリット。Rの基本。
- 2022-04-11 14:30 | データの可視化
- 2022-04-12 14:30 | データ構造の処理1: 抽出、集約など。
- 2022-04-12 16:00 | データ構造の処理2: 結合、変形など。
- 2022-04-13 14:30 | データ内容の処理: 数値、文字列、日時など。
- 2022-04-13 16:00 | 統計モデリング1: 確率分布、尤度
- 2022-04-14 14:30 | 統計モデリング2: 一般化線形モデル
- 2022-04-14 16:00 | データ解釈の基礎知識、レポート作成
- 2022-04-18 13:00 | 発表会