ヒトの細胞の世界:世界で一番詳しい解説図が公開されています

世界一詳しいヒトの細胞の図解が2018年に公開されています。細胞を構成している分子についての知識は飛躍的に増えていて、X線結晶構造解析、核磁気共鳴(Nuclear Magnetic Resonance: NMRと略します)、クライオ電顕などを使って、細胞内での生体分子の様子がずいぶんわかってきました。その成果の集大成の図といえるでしょう。

こんな図です。きれいですね。秘密の花園みたいにきれいです。図には二つの細胞が描かれています。図の右上隅の細胞は、カドヘリンを介して画面のほとんどを占めている細胞と接着しています(この記事の下から二番目の図にカドヘリンのある場所がしめしてあるのでご覧ください)。画面左上からカドヘリンによる接着部位に向かって広がっているのは細胞膜とその膜上および膜外(細胞外基質)にあるいろいろな分子です。画面左下の黄色いバスケットのように見える部分(核膜孔)の周りの膜は、核膜などでその下は核の内部です。青い紐はDNAでいろんな転写因子も描かれています。

Cellular landscape cross-section through a eukaryotic cell, by Evan Ingersoll & Gael McGill – Digizyme’s Molecular Maya custom software, Autodesk Maya, and Foundry Modo used to import, model, rig, populate, and render all structural datasets
こちらには同じ図ですが、図のあちこちをクリックすると分子の名前だとか分子の詳しい説明などがみられる図(クリックしてサイトを開いてみてください)が掲載されています。ページを開くと上の図が大きく表示されていますが、下に6枚、上の図の部分図が表示されています。絵で描かれている分子の部分をクリックすると、分子の名前が英語で表示され、ダブルクリックすると分子の情報を英語で詳細に書いてあるページが開きます。以下の図はこのサイトの使い方の一例です。
図の中の細胞と細胞の接着部位にある分子をクリックしてみましょう。

マウスカーソルが指に変わって、n-cadherinという分子名が表示されます。これはN-cadherinです。

下の図に示すように、各図の左上にSelect a pathwayと書かれているプルダウンメニューがあります。プルダウンして、Cell Structureを選んでみましょう。以下のような細胞の構造に関わっている分子とその分子名が一斉に表示されます。これでチューブリンだのアクチンだのがどこにあるかが一目瞭然ですね。それぞれの分子をクリックすると分子の解説ページが開きます(何故かN-cadherinの場合は開きませんでした)。

この図で灰色っぽい白に表示されているのは、細胞膜です。上の細胞と下の細胞が結合している部分にN-カドヘリンがびっしり膜から生えているように見えるのがわかると思います。この接着部位は、接着結合(adherens junctions)あるいはその一例である 細胞をぐるっと取り囲む接着帯(adhesion beltあるいはzonula adherensとも言う)と呼ばれています。図の細胞膜の表面(図の左上のすみのほう)には、プロテオグリカンの一種であるperlecanが描かれています。図をひらいてみていろいろクリックしてみて細胞がどんな分子で構成されていて、それぞれの分子がどこにあるかなどをみてみてください。
このMcGillさんたちが作った図では分子の密度は実際のものより薄まっていると書かれています。実際はもっと細胞内は分子が込み合っているようです。

Firefoxの不具合をリフレッシュ機能で解消する

昨日はFirefox の古いesr版を最新版へとアップグレードする方法とScrapBookやSageのアドオンの代替品を紹介しました。スムーズにアップグレードできる場合とできない場合がありましたが、後者の場合はFirefoxのバージョンを上げたり、下げたりいろいろいじっていたのがうまくいかない原因だろうと思います。
後者の場合ですが、無事にScrapBookとSageの代替品のインストールも終わって、どちらもうまく使えるようになったので一安心して、再起動すると、なんとツールバーのScrapBookとSageのアイコンが透明になって、マウスをあてると、そこにアイコンは存在するのですが押してもうまく動きません。そして設定したscrapbook.rdfの場所や、Sage feedsの場所の設定も消えてしまっていて初期設定に戻っていました。いろいろGoogle検索したのですが解決法はみつからず、結局Firefoxのリフレッシュを試したところ、うまくいって不具合を解消できたのでやり方をメモしておきます。

リフレッシュのやり方はここにあります。
https://support.mozilla.org/ja/kb/refresh-firefox-reset-add-ons-and-settings

リフレッシュすると、アドオン(拡張機能)やその設定などは消えてなくなりますが、ログインパスワードを含むログイン情報、ブックマークなどは保存したままFirefoxの不具合が解消されるそうです。不具合のあるFirefoxで、上のリンクにアクセスして、ページ内のリフレッシュボタンを押すなどするとリフレッシュが始まります。リフレッシュ中に今までのprofileフォルダはOld Firefox Dataという名前のフォルダとしてデスクトップに保存されるので、デスクトップフォルダの空容量がprofileフォルダを保存するのに十分かどうかを、リフレッシュの実行前に必ず確認しておいてから実行してください。このOld Firefox Data フォルダには前のprofileがそのまま残っていますので、リフレッシュで不具合が出た場合は、このprofileから復旧できます。

リフレッシュが終わるのに時間がかかる人が多いかもしれませんが、じっとまちましょう。しばらくするとリフレッシュが終わります。私の場合、復元とかいうボタンがでたので押しました。終わると私のブックマークタブとかもきれいになくなっていて失敗かと思ったのですが、右上の三本線ボタンを押して、ヘルプ、トラブルシューティング情報、profileで確認すると全く新しいprofileフォルダができているのがわかりました。その中にはたしかにブックマーク情報もはいっているようでした。これを確認した後再起動すると、(記録をとっていなかったので二回目の再起動後かもしれません)めでたく前のブックマークやログイン情報その他が復活しており、ログイン情報も残っているのがわかりました。リフレッシュの仕様によって、すべての拡張機能(機能拡張、アドオン)はなくなっているので、さっそくSage-likeScrapBeeLie Science Dictionary Tool WebExtensionなどのアドオンをインストールしました。最後のアドオンは、Life Science Dictionaryのアドオンで、マウスカーソルを英語にあてると訳や例文がポップアップするものです。pdfをブラウザで表示すればpdfを読む時にもポップアップ辞書として使えます。私は文献の整理にZoteroを使っていますので、Zoteroのページにいって、Zotero Connectorというアドオンをインストールしました(firefoxの機能拡張ページにzoteroといれても見つかりませんでした)。このアドオンはZoteroを起動しておいた状態でツールバーのZotero connectorアイコンをクリックすると文献情報やpdfを一発でZoteroにダウンロードするものです。ZoteroはEndNoteなどのように文献整理、論文の文献欄の作成などができるソフトです。いろいろな無料文献ソフトの中では個人情報の扱いが一番ちゃんとしているようなのでここ数年はこれを使っています。

写真は散歩の途中でみつけた からすうり です。梅の木にからまっています。後ろに見えるのは柿です。秋も深まってきていますが、ここ数日、福岡は20度を越えていて、暑いです。

Firefox 52.9.0esr版からFirefox Quantum最新版へのアップグレードおよびScrapBookとSageアドオンの代替品の紹介です

Firefox esrのFirefox Quantum最新版へのアップグレードのやり方およびScrapBookとSageというアドオン(拡張機能、機能拡張)の代替品の紹介をします。

プログラム本体とアドオンの扱いにわけて説明します。まずアップグレードの失敗に備えてprofileフォルダのバックアップをとっておきましょう。profileフォルダの中には、ログインパスワードやブックマーク、機能拡張(アドオン)の情報などなど、重要な情報が集められているので、更新に失敗してもバックアップしておいたprofileフォルダを使って失敗前のFirefoxに戻すことができますので是非ともバックアップをとっておいてから以下の作業をやってください。

profileフォルダの探し方は下の図のとおりです。

Firefoxの右上のバーの中にある、三本線が積み重なったマークをクリックして開くメニューから、矢印で示してある「ヘルプ」をクリックして、「ヘルプ」メニューにある「トラブルシューティング情報」をクリック、「トラブルシューティング情報」メニュー中の「プロファイルフォルダー」の項目にある「フォルダーを開く」のメニューからprofileフォルダの位置がわかります。このprofileフォルダ全体を万一のために別の場所にバックアップしておいてください。
この際、profileフォルダのバックアップ先は、決してFirefoxのインストール先のフォルダにはしないことが大事です。Firefoxをインストールするときに上書きされるようなフォルダはバックアップ先には不適です。不具合が生じた時の以前のFireifoxへの戻し方の概略は、アップグレードに失敗したFirefoxをアンインストールし、インストーラーを使ってもとのFirefoxを再インストールし、インストール後にできたprofileフォルダを、バックアップしてあったprofileフォルダに中身を入れ替えるだけです。

ではいよいよアップグレードにとりかかりましょう。

アドオンの取り扱い。
まずFirefoxのQuantum(Firefox 57以降版)にアップグレードする前にQuantumでは使えなくなるアドオン(機能拡張)を調べて、代替アドオンをGoogle検索などを使って探してインストールする準備をしておきましょう。代替アドオンの名前などをメモしておけばOKです。

私の場合は、Firefoxのアドオンで、昔から使ってたScrapBookとSageの代替アドオンを探しました(どちらもFirefox Quantumでは使えません)。

1)ScrapBookは元のデータを含めてScrapBeeというアドオンで代替利用できます。
https://addons.mozilla.org/ja/firefox/user/13434730/

ScrapBeeというアドオンは、ScrapBookのデータを読み込めますので、Firefoxをアップグレードする前に、Scrapbookの元データの場所を確認しておいてください。普通 元データはFirefoxのprofileフォルダの中のScrapBookフォルダにありますので、profileフォルダ全体ををバックアップしておくとバックアップから復元できます。FirefoxのProfilesフォルダの下に、固有の文字列のあとに”.default”とかいてあるprofileフォルダ(たとえばabcdef7x.defaultというようなフォルダ名になっています)があります。これを開くとFirefoxのいろんなデータフォルダがあって、その中にScrapBookという名前のフォルダでデータが保存されているのがわかります。このフォルダを開くとそこにscrapbook.rdfファイルがありますのでこのありかをScrapbeeのoptionで設定すると、ScrapBookで蓄積したデータを最新版のFirefoxで利用することができます。もちろん新たなweb pageの保存もできます。

Scrapbeeのインストールと使い方についての日本語による解説記事は以下をご覧ください。
http://rainbowvortex.blog.fc2.com/blog-entry-121.html

Scrapbeeに元のScrapBookのデータのありかを教える必要がありますが、上の記事にあるように、Scrapbeeのoptionメニューでscrapbook.rdfファイルのありかを記述してそれを保存すればよいだけです(ScrapBookデータフォルダはFirefoxのprofileフォルダの下にあり、ScrapBookフォルダの直下にこのrdfファイルがあります)。ScrapBook フォルダを開いてscrapbook.rdfというファイルの場所を絶対パス表示で表示してそれをコピーしてScrapbeeのオプション設定に記入します。記入後設定をsaveすると、うまくいけば、昔のScrapBookで保存した記事のリストが一覧表示されます。うまく読み込めない場合は、ScrapBookフォルダの場所をFirefoxのprofileの下の位置から、デスクトップなどFirefoxと関係ない場所へ移してやってみてください。読み込めるはずです。

2)RSSリーダーのSageはSage-likeというアドオンをインストールして代わりにしています。
https://addons.mozilla.org/ja/firefox/addon/sage-like/
このアドオンをQuantumにインストールしてから、まだフィードファイルフォルダを設定していないので、オプションの設定メニューを使って、以前Sageで設定していたRSSフィードのデータを一括取り込みします。下図のようにオプションメニューを開きます。

Feeds Bookmark folderというのの設定項目が一番上にあります。select feeds folderというプルダウンメニュー(左図の矢印)をひらくと、Bookmarkの他にSage feedsという項目がいくつかあります。このアドオンにはじめからついてきているfeedsもありますが、たぶん下のほうにあるSage feedsをクリックすると、いままで使っていたSageアドオンのfeedsのリストが見つかると思います(右図矢印)。それを選べば、以前と同様にSageで設定したfeedが使えるようになります。

Firefox のQuantum最新版へのアップグレード

先ずアップグレード前の注意点です。
Firefoxをアップグレードする前に、今使っているFirefoxのprofileフォルダをバックアップしておくのを強く勧めます。プロファイルフォルダの場所の見つけ方は上に説明したとおりです。以前の記事にもありますので参照してください。このprofileフォルダにはパスワードやログイン情報の他、多くのアドオンのデータも保存されています。上に書いてあるScrapBookというアドオンのデータもこのフォルダの中にあります。このprofileフォルダさえあればFirefoxが異常になった時でも再インストールなどして前の状態を復活できますので、Firefoxをいじるまえに是非バックアップしておいてください。

Firefoxの古いバージョン52.9.0 esr版がインストールしてあるパソコンがあったので、Firefoxを起動し、メニューの「ヘルプ」→「Firefoxについて」を選んでFirefox 60.9.0esrへアップグレードします。これはアドオン以外は問題なくアップグレードできるでしょう。(どのアドオンが使えなくなったかがわかるのでそれをみて必要な代替アドオンを探してください。)このFirefox esr 60.9.0がインストールしてあるパソコンを最新のFirefox esr 78.4.1にアップグレードしてみました。

一台目のパソコンでは、Firefoxを起動しておき、「ヘルプ」→「Firefoxについて」を選択して更新のチェックを行い(左図)、更新版としてesr 68.12.0が表示されるので更新ボタンをクリックしてアップグレードしました。その後、もう一回同様にヘルプで更新を確認すると、さらに更新があることがわかったので、クリックしてFirefoxを再起動してesr版の最新版である78.4.1へアップグレードできました。以前使っていたプロファイルもそのまま引き継がれて、なんら問題なくアップグレードできました。

ところが別のパソコンでは、アップグレードに失敗しました。そのPCにはFirefox esr 60.9.0がインストールしてあったのですが、ヘルプをクリックして更新を確認したところ、前と同様にesr版の68.12.0へのアップグレードがあると表示されました。クリックしてFirefoxを再起動して更新をインストールしたところ、起動するときにprofilesがないという英語のメッセージ profiles missingがでて昔のプロファイルを読み込めませんでした。Google検索してみると、profileの扱いがFirefoxの67から変更されたことによるらしく、アドレスバーにabout:profilesといれて表示されるいくつかのプロファイルリストに以前使っていたprofileがあればそれを選択するとよさそうでした。mozillaのサイトの説明は不親切で、それをどうやるのかがわからず困りました。

結局はスムーズにアップグレードできたのですが、うまくいった理由はよくわかりません。やったことは、上に述べたようにアドレスバーにabout:profilesとうちこんでエンターを押して表示される、プロファイルリストのページを表示した状態で、「ヘルプ」→「Firefoxについて」を選び、更新の確認を行い、68.12.0が表示されるので更新ボタンをクリックして、Firefoxを再起動しました。すると何の問題もなく以前のプロファイルを保ったまま68.12.0にアップグレードできました。この状態ですぐにヘルプから更新の有無をチェックすると、更新があると表示されたので、更新ボタンをおしてFirefoxを再起動しました。すると何の問題もなく元のプロファイルのままで無事、esr版の78.4.1にりました。しかし再起動するとまたprofileがないとかいってきて、Firfox自体が起動しません。そこでウインドウキー+Rをおして、ファイル名を指定して実行のメニューを呼び出し、firefox -Pとタイプしてfirerfoxを起動しました。するとプロファイルメニューの一覧がでるのでこれから古いプロファイルメニューを選び、いつもこれで起動のチェックをいれて起動します。これで無事昔のブックマーク、パスワード、ログイン情報などが残っているfirefoxが起動しました。これでよさそうだったのですが、まだトラブルは続きました。その症状と解決法は明日書くことにします。

ほとんどの方はprofile missingなどの表示もなく私の一台目のパソコンと同様に最新版にアップグレードできるのだと思いますが、もしできない方がおられましたらこの記事を参考にしてみてください。

windows7のサポート終了:windowsをやめてlinuxへうつるチャンスです(1)

福岡では2月17日に、ちらちらと初雪を観測しました。今まで一番遅い初雪の記録2月6日を111年ぶりに更新したそうです。

さて今日はこのところいろいろトライしているウインドウズ7のサポート停止に対する対策を書いておきます。そろそろlinuxを中心にパソコン生活を始めようというわけです。
上の写真はLinux  Mintを起動した時のデスクトップです。windowsとよく似ていますね。linuxといえばターミナルでのコマンド操作というのがよく話題になりますが、windowsとそっくりのデスクトップでマウスで操作するだけで使えますので、まずはこうしたwindowsなみのグラフィカルインターフェイスで使うのがおすすめです。

私はwindows7で動くパソコンをもっているのですが、windows7のサポートが今年の1月14日で終了した(windows defenderの更新はつづいているようです)ので、それに対する対策を講じなくてはなりませんでした。九大図書館などに自宅からwindows7を使っているパソコンでアクセスするとき文献をダウンロードしようとすると、画面一杯に警告画面が表示され、windows10への切り替えを促され、文献のダウンロードはできなくなっています。セキュリティを考慮した措置ですが、まだまだ問題なく使えるwindows7なのにうっとうしいサポート切れ対策を余儀なくされるのにはほとほと、うんざりさせられます。以前windowsXPのサポート切れにともなって、XPからwindows7にアップグレードするときも研究室の多数のXPパソコンをいちいちアップグレードするのは大変でした。今回は大学で使っているwindows7のenterpriseエディションからwindows10へのソフトやデータを残したままでのバージョンアップは結構簡単にできるのですが、それも結構時間と手間がかかるわけです。また使っているパソコンによってはスペックが不足してwindows7のように快適には使えないことがわかりました。windows7でインストールしたソフトもあるし、それがwindows10で動くのかも不明です。パソコン自体はwindows7で問題なく動いているので、無駄な追加投資をしたくないと思い、windows7はネットワークから切り離して利用することとし、ネット接続するときはlinuxを使うことにしました。参考になったのは日経からでているムックの「Windows 7パソコンをLinuxで復活させる本」です。日経Linuxの最近の記事をまとめたものですが、丁度windows7のサポート停止でウインドウズを止めようと思っている方には最適の本だと思います。

要は、windows7のパソコンはネット接続をせずに利用し続け、ネット接続には外付けハードディスク(あるいはSSD, USBでもだいじょうぶです)にインストールしたlinuxを使うという方針です。近頃はほとんどの作業はブラウザでやるので、linuxでブラウザを使う、メールをやりとりするなどができればネットでの作業はことたり、ネット接続していないwindows7を起動すれば、今まで使っていたwindows7で動いていたソフトもそのまま利用できます。(linuxにはwineというソフトがあって、幸運ならwindows7で使っていたソフトもlinuxのwineで動くかもしれません。)

ubuntu などの、日本語入力システム付のlinuxのインストールディスクを使って、USBや外付けのSSDや外付けHDDにlinuxをインストールします。こうしておけば、linuxをインストールした外付けのSSD(HDDでもUSBでもいいです)をwindows7で動くパソコンにとりつけてUSB接続したSSD(HDDあるいはUSBメモリ)から起動すればLinuxが使えますし、USB接続を外して(つまりUSBケーブルを外して)起動すればあいかわらず今まで使っていたwindows7が使えます。(他のwindowsとの共存のやり方としてはデュアルブートといって、起動したらlinuxかwindows7かどちらを使うかを選んでから起動すると言う便利な方法もありますが、これはどちらか一方が壊れたときとかにトラブルがおこることが多いそうですのでやめました。またlinuxの中でwindows7の仮想マシーンを起動して利用するというのもありますが、パソコンのスペックがいるし、windows7の仮想ディスクをつくるのにproduct IDがいるとかいろいろめんどうくさいのでやめました。)というわけで以下は外付けSDDにlinuxをインストールする手順です。

いろいろあるlinuxの配布版(ディストリビューション、ディストロ)のどれを使うか?distributionにはいろいろあってどれを使うか迷うのですが以下のようなdistributionは有名です。

Ubuntu Desktop 日本語 Remix
Linux Mint これには3種類あってCinnamonというのがおすすめです。32bit版と64bit版があります。
・puppy linux日本語版
・Pop!_OS(プライバシーを重んじているlinuxでファイルは自動で全部暗号化され、この配布版を作成している会社にデータを送ることもないそうです。日本語の利用設定も簡単)
・Zorin OS(これはwindowsからの乗換え用をうたっているものです。商用版あり)

これらはwindowsからの乗換えの記事でよくとりあげられています。私は最初 puppy linuxをUSBメモリに入れて使ってみました。linux mintは世界で一番多く利用されているlinuxだそうで、壁紙もきれいなのでこれもおすすめです。私はネットで情報が多い、Ubuntu Desktop 日本語 Remixを採用しました。これも他のdistributionと同じではじめから日本語入力システムMozcがセットでついていて便利ですし、windowsでつかっていたIMEの辞書も簡単に移行できるのでおすすめです。(下はLinux Mintの画面で、windowsのスタートボタンにあたるところをマウスでクリックした様子です)
長くなりましたので、今日はこの程度にして次回からは具体的なインストールの手順を書いていこうと思います。(次回のリンクはここです。

他のやり方としてはVirtualboxというソフトをウインドウズのパソコンにインストールして、仮想マシーンとしてlinuxを動かすこともできます。これは私が大学の授業でlinuxの導入実習で使っていた方法です。以前のブログの記事にはこのやり方とlinuxの入門書があげてありますのでご覧ください。

生命科学志向の有機化学の教科書が無料で読めます!量子化学の教科書とかもあります

台風や洪水で被害にあわれた方々に心からお見舞い申し上げます。

さて今回は、生化学や糖鎖生物学、あるいは生命科学を学ぶ人に適当な有機化学の教科書として以下の本をみつけたので紹介しておきます。また無料で科学や歴史、英語などを学べるサイトも紹介します。
Organic Chemistry with a Biological Emphasis Volume I
Organic Chemistry with a Biological Emphasis Volume II
この二冊は、わかりやすい英語で書かれた教科書で、ミネソタ大学モリス校のサイトにおいてあって、無料で利用できるオープンソースのライセンスの教科書です。下の画像をクリックすると、化学以外を含めた様々な分野のオープンライセンスの教科書がみつかります。(画像をクリック後に開いたページの左側にあるBiological/Physical Sciencesをクリックすると生物、物質科学関係の本のリストがみられます。)

Find Open Textbooks

著者のTim Soderbergさんはもとは英語専攻で、日本で英語教師を5年ほどやっておられたそうです。その後、大学に入りなおして科学を専攻し、大学院入学資格を得た後、ユタ大学の大学院に入ってJournal of Organic ChemistryのEditor-in-Chiefを長年つとめたDale Poulter先生の指導のもとで、アーキア(古細菌)の酵素であるprenyltransferaseの研究(それぞれtRNAと膜脂質の修飾に働く2種の酵素の研究)で生化学で博士号を取得。2000年から2016年までミネソタ大学の准教授として有機化学を教えておられた方です。生化学の研究をしていた、有機化学に詳しい先生の書いた本なので生体分子をとりあげて有機化学を学ぶという方針で書かれています。これは生命科学を学ぶ人のための有機化学の教科書としておすすめできると思います。章内問題の解答や章末問題の一部の解答もダウンロードできますので勉強しやすそうです。

あと、Open Educational Resources (OER)というのをご存知ですか。無料の教科書やビデオを駆使して教育していこうという趣旨の運動のようで、無料で数学、物理、化学、生物学その他を学べるという運動です。有機化学については、以下のOERのサイトもご覧ください。
https://oerdegrees.org/courses/chemistry/
https://oerdegrees.org/courses/organic-chemistry/

いろんな無料で利用できる教材へのリンクが集まっているポータルサイトです。その中にはKahn Academyというのがあって、ビデオで有機化学を学べます(トップページ左上のCoursesをクリックすると、数学、物理、化学、生物学、歴史、ミクロ経済学、マクロ経済学、英語の文法、プログラミング(JavaScriptとか)なども学べます。たとえば前に紹介したenantiomer(鏡像異性体、エナンチオマー)について紹介しているビデオとかもあります。字幕がでるビデオですので英語の勉強にもなりますよ。

またサイエンスについては以下を参照してください。
http://oerdegrees.org/programs/science/

こんなのもあります。Libretextsというサイトで、無料で生化学、有機化学、量子化学や量子力学、統計力学、物理化学、政治学などほとんどなんでも学べます。化学へのリンクをあげておきます。
https://chem.libretexts.org/
またこちらにはSolderbergさんの教科書が1冊本のカラー版でおいてあります。章の順序立てがかわっていますが、一冊まるごとダウンロードできますのでご覧ください。

糖鎖生物学入門―7 ABO式血液型の話 その2 糖転移酵素をゲノムブラウザで調べてみよう!

(糖鎖生物学入門連載記事をまとめて読みたい方は固定ページにありますのでここをクリックしてください

さて血液型と性格に関係があるかという話です。この問題に関しては、どのような論文がでているのか、文献データベースであるPubMedで検索キーワード ABO blood type personality で検索してみました。すると今日現在で42個の論文がヒットし、関係のない論文も入っていますが、たしかにABO式血液型と性格の関係を論じた論文が公表されているのがわかります。こうした論文を自分で読んで考えられるようにすることを目標にABO式血液型の話を続けます。

今回はABO血液型を決定する遺伝子について調べてみましょう。どんな遺伝子が働いてA型やB型の血液型物質が合成されるのでしょうか。そしてその遺伝子はゲノムのどこにあって、周辺にはどんな遺伝子が並んでいるのでしょうか。まわりにある遺伝子には、もしかしたら血液型と性格の関連を示唆するものがあるかもしれませんね。早速調べてみましょう。

<糖鎖は糖転移酵素が合成する>

糖鎖は通常、単糖をグリコシド結合で連結する酵素(糖転移酵素:英語ではグリコシルトランスフェラーゼ glycosyltransferaseです)を使って合成されます。転移酵素という名前がついていますが、糖転移酵素は糖鎖合成酵素です。糖転移酵素には様々な種類があり、ヒトでは現在240種類ほどの酵素が知られています(CAZYデータベース参照。ケイジ―データベースと読みます。CAZYデータベースに関する動画はこちらをみてください。詳しくは註1参照)。

ABO式血液型物質も糖鎖ですから、糖転移酵素によって合成されます。まずO型物質を合成する糖転移酵素を使って、土台のO型物質が合成されます。そのO型物質にGalNAcをα1-3結合させる酵素をGTA、O型物質にGalをα1-3結合させる酵素をGTBと呼びます。この名称に含まれているGTは糖転移酵素glycosyltransferaseの略、AやBは血液型物質を示します。酵素タンパク質であるGTAとGTBはABO糖転移酵素遺伝子(遺伝子名はABO)がコードしています。

<ゲノムブラウザでABO遺伝子を探してみよう>
このABOという名前の遺伝子がヒトゲノム中のどこにあるのかを、ゲノムブラウザで探してみましょう。ゲノムブラウザというのは、いろいろな生物のゲノムの様子を表示してくれるソフトです。オンラインで使えるものが多く、いろいろ種類がありますが、今回は有名なゲノムブラウザであるUCSC genome browser (UCSCというのはUCがカリフォルニア大学 SCがサンタクルーズ分校の意味です)
https://genome.ucsc.edu/index.html
を使ってABO遺伝子を探しだし、この糖転移酵素遺伝子との周辺を眺めみましょう。
上のリンクをクリックして開くトップ画面の
上段部分にあるGenome Browserの部分をクリックすると以下のページが開きます。プルダウンから選ぶとアジアのサイトを使えetcというページがでて面倒なので最初は単に一回クリックしてください。すると以下のヒトゲノムブラウザのページが開きます。
右上にあるgoボタンの左にある検索窓に遺伝子の名前ABOをタイプします。するとポップアップウインドウが 開いて図のように遺伝子のちゃんとした名前が表示されますのでポップアップウインドウの中のABOの遺伝子名(alpha 1,3 GalNAc and alpha1,3 Galtransferaseなどと書いてあります)をクリックします。
すると検索窓にポップアップの内容が自動記入されますので、右側のgoボタンを押します。すると新しいウインドウでABO 遺伝子が表示されます。
検索窓の下にある帯状の図が遺伝子の存在するヒトの染色体の模式図です。赤枠で囲まれている部分にABO遺伝子があることを示しており、染色体の模式図の下には赤枠で囲んでいるあたりを拡大して表示してあります。染色体の模式図の一番左にはchr9 (q34.2)とありますね。これはABO遺伝子が染色体9番のq34.2の位置にあることを教えてくれています。これでこの遺伝子がヒトの第9染色体のバンドq34.2とよばれる部分にあることがわかりました。このようにして遺伝子名を検索窓に入れて検索すると、検索した遺伝子の存在するゲノム内での位置がわかります。

染色体の模式図の下にある拡大図ではABO遺伝子のエクソンとイントロンの構造がよくわかります。このABO遺伝子はGalあるいはGalNAcを転移する活性をもっているタンパク質をコードする遺伝子です。この遺伝子は354個のアミノ酸からなるタンパク質をコードしています。354個のアミノ酸の中の、たった4個のアミノ酸の違いでABO遺伝子の産物がGTAの機能(A型物質合成酵素活性)をもつか、GTBの機能(B型物質合成酵素活性)をもつかが決まるのです。O型の人はこの糖転移酵素遺伝子(ABO)の塩基配列の中に停止コドンが入っており、酵素活性のある糖転移酵素が合成できません。このためO型物質にGalやGalNAcが結合せず、土台のO型物質のみをもつO型の血液型になります。ABO遺伝子という名前の糖転移酵素遺伝子ですが、O型物質をつくる酵素活性はもたないので注意してください。

では、この遺伝子の周辺にどんな遺伝子があるかをゲノムブラウザで眺めてみましょう。
上の図のように開いたゲノムブラウザ画面の上のほうにはzoom in (1.5x 、3x、10x、baseのボタン)とzoom outのボタン(1.5x 、3x、10x、100xのボタン)があります。zoom inのほうのボタンは表示をさらに拡大(遺伝子を大きく拡大表示したりbaseボタンを押して塩基配列を表示)、zoom outのほうは遺伝子をゲノム中でもっと小さく表示して遺伝子の周辺をみるのに使います。
遺伝子の周辺をみたいときにはzoom outのボタンを押します。1.5xを一回押してさらに10xを押すと表示を15倍に拡大というふうに何回かボタンを押してみやすい倍率まで拡大縮小をするのが普通です。

ABO遺伝子の周辺をx10ボタンで拡大表示(zoom out)した例がこれです。
図ではABOの右側にSURF6, MED22その他いろいろな遺伝子があるのがわかります。
100xボタンを一回押した画面を下に載せておきます。
それぞれの遺伝子名をクリックすると、その遺伝子の説明が開きます。100xボタンを押して表示される遺伝子にDBHというのがありますね。これはdopamine beta-hydroxylase (DBH)遺伝子でこの遺伝子がABO式血液型と性格に関連があるという研究のきっかけになったことがある遺伝子です。これが論文です。
https://journals.plos.org/plosone/article?id=10.1371/journal.pone.0126983

たしかに染色体の同じバンド内にありますね。この論文はGoogle検索してみると出版以来15回ほど引用されています。Web of Science検索では5回でした。

註1:糖鎖を合成する糖転移酵素や分解酵素など糖に関する様々な酵素が網羅されているデータベースです。ヒトだけでなくバクテリアからC. elegansやショウジョウバエ、ゼブラフィッシュやカエルや植物、マウスなど、さまざまな生物別に糖関連の酵素が網羅されています。

お知らせ―サイトを常時SSL化しました!(5/27日追記有)常時SSL化の手順

昨日、WordPressで作っているこのサイトをSSL化しました(SSLはSecure Sockets Layerの略だそうです)。具体的にはサイトにアクセスしてもらったとき、ブラウザのサイトのurl表示のところが鍵マークになり、ブラウザとサイトのサーバー間の接続が暗号化されるようになるということです。最近のブラウザではhttpsでアクセスしないと警告表示がでたりしますので多くのサイトが常時SSL化をしています。昨日やってみましたが以外に簡単にできました。今後はアクセスするときのurlがhttp://glycostationx.orgからhttps://glycostationx.orgにかわるというわけです。

以下は覚書をかねたSSL化したときの手順です。各自ご自分のサイトに合わせて読み替えてみてください。(写真はひと月ほど前に咲いていたリンゴの花です。今年は去年より沢山花が開きました。意外かもしれませんが、九州ではリンゴも栽培されています。)

1.最初にSSL化の失敗に備えて、サイトhttp://glycostationx.orgを丸ごとバックアップしました。サイト自体をAll-in-One WP Migration というWordPressのプラグインでバックアップして保存しておきます。やり方は簡単で、このプラグインをインストールしたあと起動し、エクスポートを選びます。画面がエクスポート用画面に変わるので、エクスポート先をクリックして出てきたメニューから、ファイルを選びます(クラウドを選ぶこともできます)。するとサイト名であるglycostationx.orgをダウンロード、サイズ:何メガバイトなどと表示されるので、拡大収縮表示されている部分をクリックして、保存先をパソコンの適当な場所に指定してダウンロードしたらOKです。この作業は以下を参考にして実施しました。
https://smakoma.com/wordpress-backup-restore.html
(もちろんこのようなプラグインを使わず、ftpなどでサイトのファイルを丸ごとダウンロードすることもできます。こちらのほうがギガバイト以上あるようなサイトの場合は早くて確実だと思います。)

2. サイトのバックアップができたら、次に私の使っているレンタルサーバーで無料のSSL証明書を発行してもらってSSL化を申請して、http://glycostationx.orgをhttps;//glycostationx.orgに変えました。これはレンタルサーバーごとに手順があるのでお使いのサーバーのマニュアルなどで調べるか、Google検索などでレンタルサーバー名とSSL化などのキーワードで探してみてください。エックスサーバーでのやり方を解説している以下のページはとても参考になりました。https://nelog.jp/wordpress-ssl
私の使っているレンタルサーバーでは、SSL化を申請後、1時間もかからずにサイトにhttps://glycostationx.orgでアクセスできるようになりました。

3.次に、WordPressのダッシュボードで、設定―一般とすすみ、WordPressアドレス(URL)とサイトアドレス(URL)の項目(どちらもhttp://glycostationx.orgになっている)をhttps://glycostationx.orgへと変更して変更を保存します。

4.次に、http://glycostationx.orgをブックマークしてある方などをhttps://glycostationx.orgへと自動で誘導するように設定する作業を行います(これはサーバー側での301HTTPリダイレクトというそうです。)。これには.htaccessのファイル(ドットエッチティーアクセスファイル)を編集します。とても簡単な作業で、
サイトの”.htaccess”ファイルの先頭に以下を追加しておくだけでOKです。
RewriteEngine On
RewriteCond %{HTTPS} !on
RewriteRule ^(.*)$ https://%{HTTP_HOST}%{REQUEST_URI} [R=301,L]

.htaccessファイルの編集には、自分のドメインのフォルダの下にあるpublic_htmlの中にある.htaccessファイルを編集します。レンタルサーバーが.htaccessファイルを編集する手段を提供している場合はレンタルサーバーのツールで編集するのもよいですが、安全のため、いちどftpなどで.htaccessファイルをダウンロードして、保存しておき、テキストファイルエディタで開いてみて中身をよくみてから編集するのをすすめます。

今回、サイトでの.htaccessファイルのありかを確認してftpでダウンロードし、編集してアップロードするには、WinSCPというファイル転送ソフトを使いました。
https://winscp.net/eng/docs/lang:jp
このソフトはデフォルトではドットが先頭についている隠しファイルは表示しないので、ソフトを起動して環境設定―パネルを選び、「一般」にある「隠しファイルを表示する」にチェックを入れるのを忘れないようにしてください。こうすると.htaccessファイルが表示され、ダウンロード、アップロードができるようになります。編集が終わったら、編集済みファイルをWinSCPでアップロードしてもとあった.htaccessファイルに上書きしたら完了です。http://のサイトurlでアクセスしてhttps://のサイトへ飛ぶことを確認してください。
WinSCPは九大での旧ホームページ作りにも使っていたとても便利なFTP/SFTP/SCPクライアントソフトです。他にもiPadへのWindowsからの電子ブック転送とかにも使って重宝しています。

5.次に、自分のサイト内での画像やpdfへのリンクなどにhttp://glycostationx.orgではじまるurlを使っているので、これらをすべてhttps://に変える必要があります。1.でバックアップができていることを確認した上で、サイト内のhttp://glycostationx.orgの記述(画像やpdf, サイト内の別のページへのリンクなど)をhttps://glycostationx.orgへ一括で変更します。一括変更には、WordPressのプラグインSearch Regexを使います。このプラグインでブログ内の記述でhttp://glycostationx.orgで始まるものを検索、これをhttps://glycostationx.orgに一括で変更できるので大変便利です。検索にはプラグインのタイトルどおり正規表現も使えますが、単なる文字列でも検索・置換ができます。

注意:このプラグインは更新が3年ほどなされていないため、最新のWordPress(バージョン5.2)で使うと、エラーのメールがとどきます。ブログ名のあとに「サイトで技術的な問題が発生しています」というタイトルのメールがとどいて驚いたのですが、内容は、
”エラータイプ E_ERROR が ブログサイトのwp-content/plugins/search-regex/view/results.php ファイルの 26 行目で発生しました”などというものでした。
Google検索で以下のキーワードで調べてみると、
「”search regex” wordpress 技術的な問題が発生しました」
次のような解決策のページがありました。
https://smakoma.com/search-regex-error.html
このページのとおり、WordPressのダッシュボードからプラグインを選び、プラグインエディターを開いて、該当のエラー行を削除したら完了です。この作業後はもうエラーのメールはこなくなりました。

エラーがでなくなったところで、プラグインをインストールしてあれば、ツールメニューにSearch Regexがありますので、クリックして起動します。SourceにはPost Contentをまず選びます。Limit toとOrder Byはデフォルトのままでよいです。http://glycostationx.orgを検索して、https://glycostationx.orgへと置換したいので、Search patternと書いてある検索窓にhttp://glycostationx.org、Replace patternと書いてある置換窓にhttps://glycostationx.orgといれて、Replaceボタンを押します。するとサイト内のhtml記述中のhttp://glycostationx.orgで始まる部分が全部表示され、https://glycostationx.orgで置換された表現も併せて表示されます。この段階では置換は行われていません。ちゃんと置換すべき部分が表示されているかどうか、全部確認した上でOKならReplace & Saveボタンを押せば全部置換してくれます。このボタンの操作は戻せないので確認は慎重にしてください。終わったら他にhttp://glycostationx.orgの記述がないかを、SourceをPost excerptにして再確認します。あれば確認して置換します。他のSourceについても順次作業を繰り返し、終わったら置換終了です。

6.最終確認です。ChromeとかFirefoxとかでサイトにアクセスしてちゃんと鍵マークが表示されるか試してください。トップページや固定ページごとに試してみて全部鍵マークが表示されればOKです。私の場合は、論文と研究概要の固定ページでエラーになり、鍵マークが表示されませんでした。その部分をクリックすると画像が疑わしいというようなメッセージがでました。そこで、ブラウザのChromeで問題のあるページを表示して、右クリックしメニューの中の検証をクリックします。表示されるページでConsoleをクリックすると、問題のある画像がどれか教えてくれるので修正することになります。私の場合は、画像を九大の旧サイトを参照することで表示しており、このサイトへのリンクがhttpsではなかったからエラーになったのがわかりました。訂正すると無事、全部鍵マークになりました。

7. あとはGoogle Search ConsoleやGoogle Analyticsへの登録が必要になったりするサイトもあるかもしれませんので、その場合は、各自検索して調べてみてください。

私はGoogle Search Consoleを使っていますが、その場合はプロパティの追加で、URLプレフィックスではなくて、ドメインのほうを選びます。ドメイン名を入れて続行ボタンを押すと、「DNSレコードでのドメイン所有権の確認」という画面に変わり、テキストレコードが発行されます。このテキスト(特定のドメインの同定用の文字列です)をコピーして、サイトのサーバーのDNS編集画面から、このテキストを内容とするTXT タイプの新しいDNSレコードを作成します。DNSレコードの追加が終わったら、あとはGoogle Search Consoleの「DNSレコードでのドメイン所有権の確認」画面で確認ボタンをおして所有権を確認します。確認がまだですというような画面がでたら10分ほどおいて再度確認すると確認が終わると思います。この方法を使えば、http://glycostationx.orgの時のデータもそのまま移行されるので便利です。http://glycostationx.org, https://glycostationx.org, http://www.glycostationx.org, https://www.glycostationx.orgそれぞれについてプロパティをGoogle Search Consoleで作成して所有権を確認‥‥という面倒な手順は不要です。

この方法は、「サーバー名 dns レコードでのドメイン所有権の確認」という検索キーワードで見つけました。

Oumuamuaは宇宙人の探査機か?プレプリントサーバーとその活用法の紹介その5

OUMUAMUAというのを聞いたことがありますか?昨年発見された、人類がはじめて確認した太陽系外からの侵入してきた物体で、宇宙人がつくった宇宙探査機ではないかという説がささやかれていたものです。これに関する多くのプレプリントがプレプリントサーバーにアップロードされていますので、興味のある方は読んでみるのをおすすめします。Cornell大学のプレプリントサーバーarXiv.orgにアクセスして、oumuamuaで検索してみてください。50ほどのプレプリントがヒットします。

2017年10月にみつかったOumuamuaは、見つかった時すでに地球からは遠ざかっており、毎秒26 km/sという高速で太陽系に侵入して通過していったのですが、形がみえるほどの高解像度の望遠鏡はなかったので、望遠鏡ではその姿はとらえられておらず、光りかたなどからは幅:長さの比が1-5~10とみつもられているそうです。その起源は太陽系のオールトの雲由来ではなく、また近くの恒星系の外辺にある星(たとえばαケンタウリ)なの周辺にあるオールトの雲由来とも考えられないそうです。とても遠い宇宙からの来訪者のようでこれが彗星か小惑星かなど皆が注目して観測したそうです。光の反射などから推定されたその形は通常の小惑星や彗星のものではなく、とても明るい表面をもつ物体のようで宇宙人のつくった探査機かもしれないとうわさされていました。形の想像図はヨーロッパ南天天文台(ヨーロッパなんてんてんもんだい、European Southern Observatory、略称:ESO)の機関誌The Messenger の173に載っているRendezvous with `Oumuamuaという記事のp15をご覧ください。プレプリントサーバーの論文にもありますが、探査機なら電波を出しているのではないかということで、FM波長で電波が放出されていないかの観測がつづけられたそうですが、電波は検出できなかったとのことです。ただ面白いのは、太陽の重力だけでは説明できない、異常な加速がみられたとのことで、これがもし彗星などなら太陽の熱で氷がとけて尾をひいて加速したと思われるのですが、尾の形成もなくただ原因不明の加速がみられたのでした。このブログで紹介しているプレプリントサーバーをご覧になるとそれを説明する論文がだいぶ前に掲載されていたのがわかります。ハーバード大学のLoeb先生たちの論文で、Oumuamuaの加速は、日本のイカロスで実用化されたsolar sail(太陽帆)によって引き起こされたとすると説明が容易であるというのです。このプレプリントは最近、査読にとおってAstrophysical Journal Lettersという雑誌に発表されて、最近新聞やネットニュースで大きくとりあげられました。
著者はさらに多くのプレプリントをアップロードしていますが、その中で最近Scientific Americanのブログにも公開されたプレプリントは著者の考えをわかりやすく書いていておすすめです。

ブログには埋め込みできないようですが、以下の動画に Loeb先生のインタビューがあります。
https://www.youtube.com/watch?v=WBekHr6nrU8

もしOumuamuaが宇宙人の探査機のようなものだったとしたら、それを追いかけて確認するというのも将来可能になるかもしれません。しかしもっと簡単なのは太陽と木星の重力にとらえられている宇宙人の作った人工物を探すことではないだろうかと書いています。太陽と木星の重力場は宇宙に張られた網のようなもので、この重力網にとらえられているであろう人工物(宇宙人の作った探査機など)を探すのが、電波で宇宙人からのメッセージを探すより手っ取り早いのかもしれないというわけです。Loeb先生たちはそのような物体の頻度を見積もる論文も最近プレプリントサーバーにアップしているようです。みなさんもプレプリントサーバーをいろいろ見て、活用してみてください。

Oumuamuaの論文は、アーサー・クラークの書いたRendezvous with Ramaという作品(「宇宙のランデヴー」という題で邦訳がでています)のラストシーンが思い起こさせます。またScientific Americanの記事のプレプリントを読むと、野尻抱介さんの「沈黙のフライバイ」のラストも思い起こされました。

AntConcの使い方と活用法その2―自分専用の英語論文例文集(コーパス)の作り方pdftotextの使い方

前回紹介した英語論文用の例文集に使えるAntConcはテキストファイルやhtmlファイルを扱いますが、最も身近な英語の例文集の素材はpdfファイルだと思います。そこで今回は英語の例文集の作成のために重宝する、「pdfファイルをテキストファイルに変換する方法」を紹介します。AcrobatやFoxit Readerなどでpdfを開いて、textファイルとして保存する方法は、pdfファイルが数百、数千ある場合は手作業では対応できません。こんな場合は、Acrobatなどで複数のpdfファイルを一つのpdfファイルに結合してからtextファイルに変換するという方法もありますが、そんなめんどうくさいことをしなくてもpdftotextという無料ソフトを使えば一括で複数のpdfファイルをそれぞれ別のテキストファイルに変換でますので、やってみましょう。

まずpopplerというpdfを扱うプログラミングライブラリ(その中にpdftotextが入っています)をお使いのWindows, Mac, linux用のものを選んでダウンロードしてインストールします。linuxではsudoコマンドでpopplerをダウンロードしてインストールできますし、Mac版もアプリストアからダウンロードできるはずです。私が使っているWindows 10やWindows 7のPCの場合については、ここに詳しいインストールの仕方が書いた記事がでているのを見つけました。大変丁寧に書いてありますのでそのよく読んでインストールしてください。私もこの記事のとおりにインストールして利用しています。

私はCドライブ直下にpoppler-0.68.0というフォルダ(ダウンロードしたPopplerの圧縮ファイルを解凍(解凍ソフトは註1をみてください)してできるフォルダ名のままコピーしただけです)を作り、その直下にあるbinフォルダ(binaryフォルダの意味で、実行ファイルが入っているフォルダのことです)に自分の必要なpdfファイルを集めてテキストファイルに変換しています。shareフォルダの下にはpopplerとrenameしたデータファイル(上述のホームページにあるリンク
https://poppler.freedesktop.org/poppler-data-0.4.9.tar.gz からダウンロードしたpoppler-data-0.4.9.tar.gzファイルを解凍したもの。註1参照)をおいてください。あとは以下のコマンドを記述したバッチファイルをテキストファイルエディタで作ることが必要です。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

このコマンドをテキストファイルエディタにうちこみ、できたファイルに適当な名前(pdf2txt.batとかすきな名前)をつけて保存します。保存のときデフォルトではテキストファイルで保存されれウため、pdf2txt.txtになりますのでファイル名の変更でpdf2txt.batにするか、保存時に.batで保存してください。保存場所はpdftotextのあるフォルダ(上の例ではbinフォルダ)にします。

あとは、変換したいpdfファイルを上のbinフォルダにコピーして、コマンドプロンプトでpdf2txt.batファイルを実行するだけです。日本語のファイルも英語のファイルもともにテキストファイルに変換されます。(invalid font weightというエラーが出るかもしれませんが無視してよいようです。不都合があったら教えてください。)

以下はコマンドプロンプトが初めての人むけの簡単な説明です(註2参照)。

バッチファイルというのはwindowsのコマンドプロンプト(windows7では「すべてのプログラム」の部分をみていくと、アクセサリフォルダの下にあります。windows10では下の図の左端の写真ようにシステムツールの下にあります。)でファイル名を入力してエンターを押すと、ファイル内に書いてあるコマンドを逐次実行するというものです。

矢印のコマンドプロンプトをクリックして起動するとき右クリックで、管理者として実行を選んで起動しておくと管理者としてログインしていないときにおこるトラブルをさけられますので注意してください。

今回のバッチファイルは以下のような内容で動きました。

for %%i in (*.pdf) do (pdftotext %%i %%i.txt)

意味は、iという変数にpdfのファイル名をいれ、それにpdftotextコマンドを実行してpdfのファイル名(%%i)のついたテキストファイル(%%i,txt)を作るという操作をフォルダ内にあるすべてのpdfファイル(*.pdfというワイルドカード*を使っている部分で、任意のファイル名のpdfファイルを表しています) がなくなるまで一個ずつ繰り返す(for    doの部分)というものです。

コマンドプロンプトを上に説明したように起動すると、黒いバックに白い字の画面が開きます(上の真ん中の図)
自分の今いるディレクトリ(フォルダ)の名前が表示されています。これから目的のpopplerのフォルダを探すとき、たとえばCドライブの直下にpopplerのフォルダがあるなら、コマンドプロンプトでcd ..(cdとうって、ピリオドを二回うちます)というコマンド(これはディレクトリを上に登って行くコマンドです)を何回かうってディレクトリをC:¥>にします。上の図の右端の図。
dirとうつとディレクトリやファイルの一覧が表示されます。
popplerのフォルダへ移りたいのでcd poppくらいまでをタイプしてあとはタブキーを押してください。タブの自動補完機能でcd poppler-0.68.0と自動入力されます。(このタブ補完の機能はlinuxで重宝するのですがWindowsのコマンドプロンプトでも利用できますので活用してください。) enterキーを押すとC:¥poppler-0.68.0>と表示されてディレクトリを移動したのがわかります。ここでdirとうってenterを押すとディレクトリ内のファイルとフォルダが表示されます。プログラムファイルのあるbinのフォルダ(ディレクトリ)があるのを確認してください。cd binとうってenterを押すとbinのディレクトリに移動します。C:¥poppler-0.68.0\binとなっていたら成功です(上の右端の図)。再びdirとうってenterをおします。これでこのbinフォルダ内にあるすべてのファイルとフォルダが表示されます。あとはそこにコピーしてあるバッチファイルpdf2txt.batを実行する(コマンドラインにpdf2txtとうってenterを押す)と、自動的にファイル名のついたtxtファイルができあがります。

こうして一括でpdfファイルをテキストファイルに変換したら、あとはこれらのテキストファイルをAntConcに読み込んでコーパスとして論文を書くときに参照すればいいわけです。

もちろんテキストファイルですから、テキストファイルを一括検索して、検索結果にタグジャンプして参照できるgrepコマンドも使えます。適当な、grepコマンドが使えるエディタ(たとえば有料ですが秀逸なエディタでおすすめの秀丸エディタ)でpdfの内容を串刺し検索するのもよいですね。pdfgrepというソフトもあって、これを使えばpdfファイルのままでgrepができるそうです。これはまだ使っていません。windows版をダウンロードしてさきほどのbinファイルにコピーしておけば、コマンドプロンプトで使えるのですが、linux版とちがって検索語がハイライトしなかったりしてまだ使いこなせていません。興味のある方は使ってみてください。

註1:圧縮ファイルの解凍には私は7-zipを使っています。たいていの圧縮解凍はこれでできます。
註2:パスの通し方とかは説明しないでpdftotextを使う方法を説明していますので、良く知っている方はパスを通して適当な場所にpdftotextをおいて使ってください。

AntConcの使い方と活用法その1―自分専用の英語論文例文集(コーパス)の作り方

京都でひらかれた大学の同窓会にでかけたりして更新が遅くなりました。京都は快晴で、まだもみじの季節ではなかったですが美しかったです。しかし観光客が多いこと多いこと。スペイン語や中国語、韓国語、さらにはノルウエーの旗を立てた団体もみかけました。

さて、昨年の分子生物学会のランチョンセミナーの中でAntConcというフリーソフトウエアの紹介をしました。英文を書くときに自分専用の例文集を作っておいて、それが簡単に検索できればとても役立ちます。前回紹介したTextClipperで役にたちそうな例文をテキストファイルに集めておいて、AntConcというフリーウエアでコンコーダンス検索してヒットした例文を参考に英語を書く方法を紹介します。もちろん自分の関係分野の論文のpdfをテキストファイルに変換して集めておき、それをAntConcで検索してもいいわけです。pdfをテキスト化するには、pdfをAcrobatなどで開いておいてtextファイル形式で保存するのも一つのやり方ですが、一斉にpdfをテキスト化するならLinuxやWindows、macなどにあるpdftotextといったソフトを使うのが便利です。ウインドウズにもこれが含まれているLooperというソフトがありますのでそれを使うといいでしょう。これについては次回紹介します。

それではAntConcの使い方の解説をはじめます。AntConcはコンコーダンスソフトウエアという種類のソフトウエアで、検索語を入力するとテキストファイルからその単語を拾い出し、文中に含まれるその単語の前後をふくめて表示してくれるソフトです。単語の文中での出現頻度などその他の様々な情報もわかります。まず早稲田大学のLaurence Anthony先生ホームページから自分のパソコンのOS(mac, windows, linux)にあったソフト(無料です)をダウンロードします。ここのリンクをご覧ください。
AntConcのホームページには、YouTubeの解説動画や日本語の解説pdf(バージョン3.2,2の解説ですがとても参考になります)などへのリンクもありますので適宜参照するといいでしょう。
ダウンロードしたファイルは実行ファイルなのでダブルクリックして起動します。詳細な使い方は先生のhelpファイルのpdfがあるのでダウンロードしてみてください。

写真はダブルクリックして起動した直後の画面です。起動時にはConcordanceタブが開いています。 Fileメニューが上にあります。Fileメニューをクリックするとプルダウンメニューが開き、その一番上にあるOpen File(s)を選んで検索したいファイル(複数選択可能です)を読み込みます。(下の図)

複数のファイルを読み込んで串刺し検索もできます。またOpen Filesの下のOpen Dirを選ぶと、フォルダ(あるいはDirectory)内にあるすべてのテキストファイル(とかhtmlファイル)を検索してくれます。こうして必要なファイルを開いてやると以下のような画面になります。
下の写真は私達の論文(AkiyoshiさんのCGGDBデータベースについての論文をpdfからテキストファイルにしたものでcggdb.txtという名称にしました)を開いたところです。
Current Filesというところに検索するファイル名が表示されます。複数選択した時は選択したすべてのファイルが列挙されます。
では検索してみましょう。resultという単語を検索することにします。Search Termの部分にresultといれて検索窓の下にあるStartボタンを押して検索してみましょう。(このとき右にあるwordsにチェックをいれています(下図参照)。単語としてのresultが検索されます。Caseにもチェックをいれると大文字小文字の区別をして検索できますし、Regexにチェックを入れると正規表現(Perlタイプのもの)が検索に利用できます)ヒット数は上のほうのConcordance Hits に表示されます。

6個ヒットしています。注意したいのはWordsにチェックを入れた状態で、resultを検索するとresultsは検索されないことです。Wordsのチェックを外してresultとして検索すると、resultだけでなくresultsもresultedもresultingもひっかかってきます。(下図)

ヒット数が57となっているのがわかると思います。
Concordanceメニュ―では、resultというキーワード(Key Words)が文のコンテクストの中で(In Context)どのように使われているかが表示されています。この表示を略してKWIC表示といいます。結果の表示法は、いろいろ下のメニューで変更可能です。たとえばSearch Window Sizeはデフォルトで50文字(腱索キーワードの前後50文字ずつ)となっていますが、これは増やしたり減らしたりできます。ちょっと表示を左右に広げてみるとよくわかります。

Search Termの検索窓の下のほうにKwic Sortとあるのは、検索結果のソートボタンです。

図ではLevel 1が1R(キーワードresultの右の語でアルファベット順にソート)、Level 2が同じ右の単語の場合は、キーワードの二番目の単語でさらにソートします。それがLevel 2 2Rという部分です。Level 3は三番目の単語でさらにソートとなります。もしresultの左の単語でソートしたいときは、Level 1以下の部分を下向きの矢印ボタンを何回かクリックして、下の図のようにかえて、Sortボタンを押してください。

すると検索キーワードの左の単語で再ソートされますので、resultの前にくる単語がわかります。

次にKWIC画面で表示されている原文をみてみましょう。みたいヒット行の青字で表示されているキーワードをクリックしてみましょう。クリックした文を含む原文がFile Viewタブが開いてそこに表示されます。

Hit Locationという部分の上下の矢印をクリックすると、前や後のresultを含む原文が表示されます。カーソルをFile View画面で動かせるようにしておくと、マウスの中央ホイールをくるくるまわして前後のresultを表視することもできます。

皆さんもご自分でつくったテキストファイルやテキストファイル群をこのソフトで開いて遊んでみてください。大変有用なソフトです。ちょっと長くなったので今回はここで止めます。次回はAntConcのその他の機能と、どうやってpdfからtextファイルを作るかについてpdftotextの使い方を紹介したいと思います。

写真は元寇のとき筥崎宮が避難していた場所を訪れたときのものです。とてもいい天気で気持ちがよかったです。バス停をおりると案内板があって、650mほどのぼりの道を行くと古い社があって記念碑がたっていました。人はだれもいません。一番最後の写真は帰りの川面です。波紋がきらきらと川底に映えてハヤも泳いでいました。このへんはホタルも初夏には見られます。