nitterで、ログインせずにtwitterをみている時に知りました。この本は無料公開されていません。
幸い、九州大学の図書館が使える人は、九大が契約しているSpringer Linkからダウンロードすることができます。pdf版やEpub版がダウンロードできますので、Springer Linkが使える人はダウンロードして勉強するとよいと思います。transformerやattentionについても取り上げられており、GPT-4まで載っています。
最新の教科書ですのでダウンロードできる方は是非眺めてみてください。 https://link.springer.com/book/10.1007/978-3-031-29642-0
著者のAggarwalさんは、IBM( IBM T. J. Watson Research Center )のトップ・サイエンティストです。 IEEE ICDM Research Contributions Award (2015) and ACM SIGKDD Innovation Awardというデータマイニング分野で最高の賞の他、数々の賞を授賞している方です。20冊以上の本(教科書を含む)も書いています。この本の初版は日本語版もでています。あまり数学的にならないで深層学習とニューラルネットワークが学べる教科書だそうで、魅力的ですね。
これは有料本の紹介でした。今日の無料本の情報としては以前紹介したR for Data Science 第2版の書籍版がでたというニュースを紹介します。前に記事にしたようにオンラインで第二版は無料で読むことができます。こちらをご覧ください。https://r4ds.hadley.nz/
また以下の記事もご覧ください。
また、RStudioを使ってRプログラミングの入門を行う講習会の教材(英語)がこちらで公開されているのもnitterで知りました。ワシントン大学での
PSYCH 548 Exploratory Data Analysis in Psychologyという講習会の資料です。スライドはわかりやすいですし、医学部の心理学科での資料ですので生命科学の人に役立つと思います。RStudio とMarkdownから始まっているので最初の部分を見るだけでも参考になります。 https://adamkucz.github.io/psych548/
”We’re back for now. https://nitter.net is up and running with an experimental patch that provides all previous functionality, except search (I have a potential fix, needs more research), without suffering from the awful rate limits imposed on the previous endpoints.
今日は結構雨が降って近所の川も濁流で水音も凄かったです。 今回は、スタンフォード大学、ワシントン大学、南カリフォルニア大学の統計学者による統計学と機械学習の入門書を紹介します。どちらの本も発行以来、絶大な人気を博している教科書で、日本語訳もすでにでています。今回紹介するのは英語の原著最新版です。最初の本は、 An Introduction to Statistical Learning with applications in R (ISLR) という本で、データサイエンス入門レベルの読者が学ぶのに最適の本になっています。2013年に初版がでて、2021年に第二版がでています。2023年にはPython 版がでたところです。こちらのサイトからダウンロードできます。https://www.statlearning.com/ このページの一番下のほうに、第1版、第2版、Python版へのダウンロードリンクがありますのでダウンロードして読んでみてください。このサイトのリンクから、プログラムコードや資料もダウンロードできますし、講義のビデオもみられます。 https://www.youtube.com/playlist?list=PLoROMvodv4rOzrYsAxzQyHb8n_RWNuS1e
著者たちは数学出身ではないので、数学をあまり知らない人間のつまづくところをよく知っており、直観的、概念的に統計学を理解できるように書いてあるそうです。読むのに多変数の微積分や線形代数の知識は不要だとのことです。ネットで探してみると、日本語でこの本の詳しい紹介をしてくださっている方がいます。https://totadata.com/book_islr/ またこちらの英語の書評も参考になります。 https://qz.com/1206229/this-is-the-best-book-for-learning-modern-statistics-its-free この書評によるとAn Introduction to Statistical Learningをマスターしてもっと学びたければ次の本を勉強するとよいそうです。 The Elements of Statistical Learning (2nd edition) Hastie, Tibshirani and Friedman (2009). Springer-Verlag. 763 pages. この書評にある最初の本ISLRへのリンクは切れているので私が上に載せたリンクを利用してください。The Elements of Statistical Learning (2nd edition) はこちらからダウンロードできます。英語版の第二版2017年の第12刷がダウンロード可能です。 https://hastie.su.domains/ElemStatLearn/ コードその他の資料もダウンロードできるので役立ちます。この本は、カステラの箱ほど分厚いのでカステラ本と呼ばれているようです。
ChatGPTに代表される大規模言語モデルLarge Language Model (LLM)はAIの時代の到来を告げる画期的研究成果です。このLLMの教科書ともいえる論文が頻繁に改訂されながらプレプリントサーバーにアップされているそうです。中国人研究者によるLLMのサーベイ論文で、”A Survey of Large Language Models”.というタイトルです。https://arxiv.org/abs/2303.18223 これを紹介している東大の今井翔太先生のtwitterを紹介しておきます。
もはやLLM界隈の教科書となっているこのサーベイ,新たに34p追加,200個以上の参考文献が追加されたようで,この分野の発展速度を物語っています “A Survey of Large Language Models”https://t.co/ymf6tnzduZ この論文,今年3月に投稿されたのですが,私が記憶している限りもう10回以上更新されてます pic.twitter.com/nNVZIrHrIL
— 今井翔太 / Shota Imai@えるエル (@ImAI_Eruel) July 6, 2023
この論文は、GitHubに公式サポートページがあって、いろいろ有用な情報や論文の図(上のtweetにある図もみられます)や表、そして改訂情報などがのっています。The official GitHub page for the survey paper “A Survey of Large Language Models”. arxiv.org/abs/2303.18223 https://github.com/RUCAIBox/LLMSurvey この論文では、LLMの発展史もまとめられていますし、実用的に興味があるところでは、 よりよいプロンプトを設計する方針についてもサーベイしてあります。論文内に参考になるプロント作成の原則が書かれています(p53に表があります)。これは役立ちそうです。 https://github.com/RUCAIBox/LLMSurvey/blob/main/Prompts/README.md
私が九州大学の生物学科に就職したときの学部生向きの授業には、不可逆過程の熱力学入門の講義がありました。Prigogine, I. (1955). Introduction to Thermodynamics of Irreversible Processes. Springfield, Illinois: Charles C. Thomas Publisher.が教科書に指定されていて、生物学科の大学院を受験する学生はこんな勉強もしているのかとびっくりした覚えがあります。私は授業をうけることはできなかったのですが、いつかはこういう分野も理解できるようになれたらなと思ったのを覚えています。 さて、それからずいぶん年月がたって、現代では非平衡の統計力学入門という講義もオンラインで聴講できる時代になりました。おすすめの講義が以下のものです。
学習院大学の田崎晴明先生がオンライン講義をYouTubeにアップロードしてくださっています。NEJ00 田崎晴明『非平衡統計力学入門:現代的な視点から』 Hal Tasaki / 田崎晴明 https://youtu.be/uowGMIQzabk
Non-equilibrium Regulation of Transcriptional Condensates Arup Chakraborty, MIT
Chromosomes as Genomic Communication and Memory Machines Leonid Mirny, MIT – via Zoom
Spatially Resolved Single-cell Multi-omics Xiaowei Zhuang, Harvard University
The RNA Code in Condensates Amy Gladfelter, UNC at Chapel Hill
Superresolution Imaging of Transcription in Live Mammalian Cells Ibrahim Cissé, Max Planck Institute for Immunobiology and Epigenetics, Germany
RNA Promotes the Formation of Spatial Compartments in the Nucleus Mitchell Guttman, California Institute of Technology
Watching Translation within Germ Granules Ruth Lehman, MIT/Whitehead Institute
Protein-based Inheritance: Epigenetics beyond the Chromosome Daniel Jarosz, Stanford University
Bimolecular Condensates in Stress and Disease Simon Alberti, Technische Universität Dresden, Germany
Superresolution Imaging of Transcription in Live Mammalian Cells Ibrahim Cissé, Max Planck Institute of Immunobiology and Epigenetics, Germany
Spatially Resolved Single-cell Genomics & Cell Atlases of Complex Tissues Xiaowei Zhuang, Harvard University
Control of Chromosome Entanglement and Disentanglement through the Cell Cycle Job Dekker, University of Massachusetts
RNA Promotes the Formation of Spatial Compartments in the Nucleus Mitchell Guttman, California Institute of Technology
Genome Organization through Phase Separation: Random yet Precise Bin Zhang, MIT
Landscapes of Genomic Architecture Across Evolution Michele di Pierro, Northeastern University
Defining How Sequence and Local Chromatin Context Regulate Gene Expression Seychelle Vos, MIT
Rethinking Protein Aggregation and Drug Discovery in Neurodegenerative Diseases Hilal Lashuel, École Polytechnique Fédérale de Lausanne, CH (EPFL) – via Zoom
Bimolecular Condensates: New Insights into Disease and the Behavior of Small Molecule Therapeutics Richard Young, MIT