-입력 :단일 세포 RNA-Seq 데이터 (카운트 매트릭스)
- 품질 관리 (QC) :저품질 세포와 유전자를 제거하십시오
- 데이터 정규화 :기술 바이어스를 수정하기 위해 데이터를 정규화합니다.
2. 클러스터링
- 정규화 된 데이터에서 클러스터링을 수행하여 셀 클러스터를 식별합니다.
- 다른 클러스터링 방법을 사용할 수 있습니다 (예 :K- 평균, 계층 적 클러스터링, 루베 인)
3. 마커 유전자 확인
- 각 클러스터에 대해 :
- 클러스터의 세포를 가로 지르는 각 유전자의 평균 발현을 계산합니다.
- 클러스터의 유전자의 평균 발현을 다른 클러스터의 유전자 표현과 비교하십시오.
- 다른 클러스터와 비교하여 클러스터에서 고도로 발현되는 유전자를 식별합니다.
4. 마커 유전자 검증
- 추가 기준은 선택 마커 유전자에 적용 할 수 있습니다.
- 접힘 변경 :클러스터와 다른 클러스터 사이에 높은 배수 변화가있는 유전자를 고려하십시오.
- 통계적 유의성 :표현 차이의 중요성을 평가하기 위해 통계 테스트 (예 :T- 검정, Wilcoxon 테스트)를 사용합니다.
- 특이성 :마커 유전자가 관심있는 클러스터에서 선택적으로 발현되도록
5. 해석 및 시각화
- 확인 된 마커 유전자와 관련된 기능 및 경로 분석
- 마커 유전자와 그 발현 패턴을 제시하기 위해 히트 맵, 화산 플롯 또는 기타 시각화를 생성합니다.
6. 독립 데이터 세트의 검증 (선택 사항)
- 신뢰를 높이려면 가능한 경우 독립적 인 데이터 세트에서 식별 된 마커 유전자를 검증하십시오.