1章

テトラヌクレオチド頻度:モノを数える

 DNA中の塩基を数えることは、バイオインフォマティクスの「Hello, World!」です。Rosalind DNAチャレンジ(https://oreil.ly/maR31)では、DNA中のACGおよびTの数を出力するプログラムについて説明をします。Pythonで何かを数える方法は多種多様にあり、ここではPythonが標準で提供する方法を探索していきます。また、引数を検証するため、適切なドキュメントを備えたプログラムを作成する方法と共に、プログラムが正しく機能することを確認するためのテストの書き方と実行方法を示します。

 この章では以下のことを学びます。

  • new.pyを使用して新しいプログラムを開始する方法
  • argparseを使用してコマンドライン引数を定義および検証する方法
  • pytestを使用してテストスイートを実行する方法
  • 文字列の文字を繰り返す方法
  • コレクション内の要素を数える方法
  • if/elifステートメントを使用して決定木を作成する方法
  • 文字列の定形出力方法

1.1 はじめましょう

 まず最初に、「はじめに」の「コードとテストの取得」をしっかり読んでください。コードリポジトリのローカルコピーを入手したら、01_dnaディレクトリに移動します。

$ cd 01_dna

 このフォルダの中には、いくつかのsolution*.pyというプログラムと、プログラムが正しく機能するかどうか確認するためのテストと入力データがあります。プログラムがどのように機能するかを理解するには、最初の解法をdna.pyというプログラムにコピーすることから始めます。

$ cp solution1_iter.py dna.py

 まず、引数をつけないで実行するか、 ...

Get Pythonではじめるバイオインフォマティクス ―可読性・拡張性・再現性のあるコードを書くために now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.