記錄你的資料分析

data science  

即使現在是 21 世紀,筆者仍然喜歡用 Unix 命令列工作。Unix 命令列有許多有用的小工具,使用起來相當地靈活。然而,你可能會有類似以下的經驗:你在某個星期密集地進行某項資料分析的任務,你飛快地使用各種命令列工具以及撰寫了數個命令稿,終於完成了這項任務,這些數據和命令稿就暫時放在一旁。過了三個月,你因為某個因素,需要重新挖出這個專案的某些資料,然而,整個專案資料夾中散落著許多中繼檔案及命令稿,你已經想不起來三個月前你做了些什麼,你只好試著從 shell history 中挖出先前相關的步驟。

我應該相信 BioPerl, BioPython 或其他的 Bio-Xxx 計畫嗎?

programming  

最近在 Biostars 上看到這個蠻有意思的討論串,主要是在探討在開發生物資訊軟體時,是否應該要以 BioPerl、BioPython 或其他的類似的專案為基礎,或者應該重新實作相關的函式庫。在程式圈裡流傳著這樣一句話:「不要重覆發明輪子。」 (Don’t re-invent the wheel.) 這句話主要的用意是提醒程式設計師,要善用已有的函式庫、框架、開發工具等,減少重覆實作相同的演算法所浪費的時間和心力。但是對於生物資訊學家來說,這個問題的答案並不是那麼單純。

Statistics and Data Analysis for Microarrays Using R and Bioconductor 回顧

microarray  statistics  

隨著次世代定序 (next generation sequencing) 的風行,微陣列 (microarray) 的重要性不如以往。那麼,在這個時候 (2016 年),這本書「Statistics and Data Analysis for Microarrays Using R and Bioconductor」是否變得無用武之地呢?本文將會簡略地介紹這本書,供有需要的讀者參考。

Previous 2 / 5 Next