生信人員為什么是全實驗室最靚的崽?

生信人員為什么是全實驗室最靚的崽?

2019-07-21 15:18:30  微科普
本文作者:500

發表時間:2019-07-21 15:18:30作者:500來源:微科普字體大小:A+  A-

生信人員為什么如此高產,經常可以發20分以上的文章,他們生產的數據的過程其實和生產力的三要素不謀而合,生產力包括什么呢?它包括勞動資料,勞動對象,勞動者。

我們一個個來說。

勞動資料,也約摸等于生產工具,他們的生產工具是貴的一皮的高通量測序儀,這也是其高大上的一個原因。目前測序儀只有少數幾家能生產,測序儀已經進化到第三代,測序成本雖然大大降低,但是對于一些單細胞的RNA測序做起來,動輒一做幾千個細胞,這都是在燒錢那,一般的實驗室燒不起,厲害(有錢)的實驗室才能做到。

雖然Illumina占據了75%的市場,但華大已經有了自主產權的國產測序儀MGISEQ-T7。

為什么測序儀難做呢?

基因測序儀很復雜,涉及到光機電、生化反應、軟件計算等不同領域。除了要生產出高精密的測序儀,還要配備有效的試劑盒,以及成套的解決方案。而且還面臨著強大的對手的挑戰。只有做的更快、更優、更長甚至更便宜才有獲取市場的可能。

勞動對象,也是你要對誰做實驗,科研人員可以對細胞的基因組,轉錄組,蛋白組等進行挖掘分析。什么?你問這些組是什么東西?那么,想了解這些東西的伙伴可以先了解一下生物界的定海神針——中心法則,這個短片通俗易懂地介紹了基因的前世今生,對你理解這個問題會有幫助。

基因的故事

每個人都有一套獨一無二的基因,它在產生你的眼睛鼻子耳朵(美貌)前,會經歷轉錄經歷翻譯一系列的過程,而科學家們將不同層面的大數據捕獲收集起來,形成了每個組,也即是基因組,轉錄組,蛋白組。當然這可比高中學的要高深多了,比如有時實驗中出現mRNA升高但蛋白量下降的情況,按理來說蛋白量隨mRNA升高而升高,但是卻反過來了,這背后的原因就有可能是翻譯的效率下降。

為什么說這是大數據呢?比如一個人的基因有31.6億個DNA堿基對,2萬多個基因,而中間產生的數據更加復雜,還不包括表觀遺傳、非編碼區的功能數據等等,加上會更多。所以一般生信人員都深諳熱圖等統計學的展示手段。因為他們有著Linux、R語言等計算機編程語言,所以這些都是颯颯隨(簡單)的東西。

紅色表示基因表達上調,藍色表示基因下調。

最后一個是勞動者啦,那就是苦逼的實驗狗和禿頭的生物程序猿啦。簡單的來說,進測序儀之前,是實驗人員的工作,拿到測序原數據后,就是生物程序員的活了。如果要做10000+個細胞的單細胞測序,實驗人員要不停地重復重復,步驟雖簡單,但重復量之多,容易讓人睡著。。。從而容易出錯。當然你愿意的話也可以用高通量的機器來操作。生信人員要做到不僅是會處理數據(雖然這已經很難了),但是更難地他們還要在一堆數據中找到差異的部分,還要乞求這些數據有生物學上的功能。

寫在最后

上面講的都是戰術,利用生信的戰略來做組學研究,當然是要多組學的綜合研究,才能多重確認結果,提供更加豐富的解釋。

生產力要高,三個要素缺一不可。科學技術是先進生產力的集中體現和重要標志,是第一生產力。放在生信上面,簡單的來說,就是程序猿處理測序儀產生的各種組數據。

生信員有時候也很囂張,面對如此,下次見面你就和他說,數據處理好了嗎?bug解決了嗎?

責編:微科普

分享到:

>相關科普知識

猫先生 <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <蜘蛛词>| <文本链> <文本链> <文本链> <文本链> <文本链> <文本链>