Week1はプログラミング言語Rについての知識が全くない生命科学者向けのRのチュートリアルです。 WEEK 1 (June 1-5): Foundations of Data Science in R Target: Assumes no prior R experience. All participants working with biological data.
Monday, June 1, Day 1 MORNING Course Overview & Orientation to Data Science Why data science in biology? Course logistics, expectations, reproducibility principles. AFTERNOON Getting Started with R and RStudio Why data science in biology? Course logistics, expectations, reproducibility principles https://youtu.be/Gab9vTWU704
Week 3は WEEK 3 (June 15-19): Bioinformatics & High-Dimensional Data Target: Genomics workflows, dimensionality reduction, penalized regression, and reproducible reporting.ということで、ゲノム解析と高次元データの扱い、再現性のある研究成果の報告についての講義です。
Monday, June 15, Day 11 MORNING – Genomics Data: Structure, Formats, and Public Databases FASTQ, BAM, VCF, count matrix formats; overview of NCBI/GEO/dbGaP; accessing public datasets; data provenance and metadata. AFTERNOON – Accessing Public Genomics Data Using GEOquery and Biobase to retrieve expression datasets; exploring metadata; quality assessment with basic EDA. https://youtu.be/v7sTKbPGWOo
最後に見慣れない略語についての解説を書いておきます。 SC INBRE (South Carolina IDeA Networks of Biomedical Research Excellence) というのは、NIHが地域間の研究格差を是正するために提供している大規模な助成プログラムIDeA (Institutional Development Award)を使ってSC(サウスカロライナ州)が実施している生命科学の底上げプログラムです。 有名大学や研究機関が集中している場所との格差を是正し、医学生物学研究の基礎体力(インフラ、人材、研究環境)を底上げするために作られたのがIDeAプログラムです。 コアになるSCの研究機関と周辺の大学・研究機関のネットワークに対する助成プログラムなので、ネットワークという言葉が入っています。
次も、コマンドラインの使い方の教科書です。
Data Science at the Command Line
Obtain, Scrub, Explore, and Model Data with Unix Power Tools
2021年発行の第2版がオンラインで無料公開されています。
コマンドラインをdockerイメージを利用して体系的に学べるとても良い教科書です。