來源:互聯網
序列數據庫是分子生物信息數據庫中最基本的數據庫,包括核酸和“蛋白質”兩類,以核苷酸堿基順序或氨基酸殘基順序為基本內容,并附有注釋信息。
數據內容
序列數據庫的注釋信息包括兩部分,一部分由計算機程序經過序列分析由計算機程序生成,另一部分則依靠生物學家通過查閱文獻資料而獲得。
數據來源
早期
序列數據庫早期的數據主要由數據錄入人員通過查閱文獻雜志搜集,或者由科研人員用磁盤、電子郵件方式向國際生物信息數據庫中心遞交。數據中心對搜集到的序列數據進行整理、維護,并定期通過磁盤、磁帶和光盤方式向全世界發布。
現狀
序列數據庫的序列數據來自核酸和蛋白質序列測定,隨著基因組大規模測序計劃的迅速開展,序列數據庫特別是核酸序列數據庫的數據量迅速增長,數據來源主要集中于國際上幾大著名的測序中心,如位于英國劍橋南郊基因組園區的Sanger Centre,美國華盛頓大學基因組研究中心等。
1999年我國參加國際人類基因組研究項目,已經于于2000年4月按計劃完成人類基因組1%序列的測定。
參考資料 >