Semantic ScholarML 방법론기법중요도 8Nature Methods
2년 전
3300만 개 세포로 학습한 단일세포 기초모델 scGPT
scGPT: toward building a foundation model for single-cell multi-omics using generative AI
Haotian Cui, Chloe Wang, Hassaan Maan, Kuan Pang, Fengning Luo, Nan Duan, Bo Wang
인용 1K인기 27.8
AI 분석
한줄 요약
scGPT는 단일세포 전사체 데이터로 사전학습된 생성형 트랜스포머 기반 기초모델로, 다양한 단일세포 분석 작업에 전이학습을 적용할 수 있다.
풀어야 하는 문제
단일세포 데이터는 고차원적이고 노이즈가 많으며, 각 실험마다 배치 효과가 달라 통합 분석이 어렵다. 또한 유전자 교란 반응 예측이나 유전자 네트워크 추론 등은 데이터 부족으로 어려움이 있다.
접근 방법
텍스트의 단어-문장 관계를 세포의 유전자-세포 관계에 대응시켜, 생성형 사전학습 트랜스포머(GPT) 구조를 단일세포 RNA 시퀀싱 데이터에 적용했다. 3300만 개 이상의 세포 프로파일로 사전학습한 후, 하위 작업별로 미세 조정한다.
결과·기여
scGPT는 세포 유형 주석, 배치 통합, 다중오믹스 통합, 유전자 교란 반응 예측, 유전자 네트워크 추론 등 다양한 작업에서 기존 방법보다 우수하거나 경쟁력 있는 성능을 보였다. 단일세포 생물학 분야의 기초모델 가능성을 제시했다.