book  

Feb 25, 2017 • Michael Chen

生物資訊 (bioinformatics) 的書籍相當地多,有些是以演算法 (algorithm) 為主,有些是以程式設計 (programming) 為主,有些介紹實用的軟體 (software) 和工具 (utility),也有一些兼具以上數種特點。Wiley 出版的 Bioinformatics Challenges 則是採取一個比較哲理上的角度,對生物資訊上一些議題進行探討,藉由這樣的過程,讓讀者進行一些反思。

首先,不要把這本書視為教科書,這本書不是深入的論文集,也沒有高深的演算法,程式碼範例也很少。這本書反而像是科學散文,例如,在這本書裡,可以看到一些生物資訊資料庫和軟體的發展史,以及這種漸進性演進所帶來的問題。這些內容,看似對做研究沒有的直接的幫助,但對生物資訊研究者提供很多的思考。例如,我們若要發展新的生物資訊資料庫,我們要採用什麼樣的模式,關連式資料庫、NoSQL 還是 flat files?我們要採用什麼樣的檔案格式,XML?JSON?或是開發新的格式?怎樣的 accession number 是比較適當的?

這本書對很多看似細微的議題提出討論,相當值得一讀。像是不同的軟體使用不同的顏色進行視覺化 (visualization) 造成認知上的謬誤。為什麼不同的序列比對軟體得到的結果大相徑庭?如何判讀?以序列這種一維資料為基礎發展演算法的限制,如何結合三維空間的結構來得到更精準的結果?生物資訊檔案格式百家爭鳴所造成的問題以及使用 XML 或 JSON 等標準格式帶來的好處。如何選擇合適的演算法及程式語言?如何因應多核心及分散式運算所帶來的改變?其實,這本書在某些地方的敘述太瑣碎了,筆者也沒有細讀完所有的內容。扣掉一些細節,這本書還是蠻有啟發性的。

對於完全沒接觸過生物資訊的人來說,這本書可能會讓人摸不著頭緒。在做過一些生物資訊的專題計畫或學位論文後,再來讀這本書,就比較能體會書中討論的議題。雖然這本書沒辦法告訴我們未來十年的研究趨勢在何方,但可以提示我們過去的種種議題。就算只當做散文集看一看,也是相當不錯的。

Disclaimer: 筆者和 Wiley 無對價關係,本文僅為個人意見。