보조 데이터베이스 란 무엇입니까?
보조 데이터베이스는 1 차 생물학적 데이터 소스에서 파생 된 사전 계산 정보의 모음입니다. 그들은 통찰력을 제공하고 원시 데이터에서 직접 얻기가 어렵거나 시간이 많이 걸리는 분석을 용이하게하도록 설계되었습니다.
주요 특성 :
* 1 차 데이터에서 파생 : 기본 데이터베이스 (예 :GenBank와 같은 시퀀스 데이터베이스)의 데이터를 처리하고 통합하여 구축됩니다.
* 조직 및 구조 : 정보는 특정 범주 및 형식으로 구성되어 검색 및 분석을보다 쉽게 할 수 있습니다.
* 부가가치 정보 : 기본 데이터를 기반으로 주석, 예측 및 해석을 제공하여 더 깊은 통찰력을 제공합니다.
2 차 데이터베이스의 예 :
다음은 초점으로 분류 된 2 차 데이터베이스입니다.
* 시퀀스 분석 및 주석 :
* uniprot : 단백질 서열 및 기능 정보.
* 통신 : 단백질 패밀리, 도메인 및 기능적 부위.
* GO (Gene Ontology) : 유전자 기능의 계층 적 분류.
* kegg : 대사 경로 및 유전자 기능.
* pfam : 단백질 패밀리.
* 게놈 및 유전자 발현 :
* Ensembl : 게놈 어셈블리, 유전자 주석 및 유전자 발현 데이터.
* UCSC 게놈 브라우저 : 게놈 데이터 시각화 및 탐색.
* geo (유전자 발현 옴니버스) : 마이크로 어레이 및 RNA 시퀀싱 데이터 저장소.
* ArrayExpress : 마이크로 어레이 데이터 저장소.
* 단백질-단백질 상호 작용 및 네트워크 :
* 문자열 : 단백질-단백질 상호 작용 및 네트워크.
* 바이오 그라이드 : 단백질-단백질 상호 작용 및 유전자 상호 작용.
* 약물 발견 및 목표 식별 :
* 약물 뱅크 : 약물 정보의 포괄적 인 데이터베이스.
* Chembl : 약물 유사 분자 및 이들의 생물학적 활동.
* pubchem : 화학 구조 및 생물학적 활동.
* 비교 유전체학 및 진화 :
* NCBI 분류 브라우저 : 유기체의 계층 적 분류.
* Phylotree : 유기체의 계통 발생 나무.
* 트리베이스 : 계통 발생 나무의 저장소.
2 차 데이터베이스의 이점 :
* 시간 절약 : 그들은 사전 처리 및 조직화 된 정보를 제공하여 연구원의 시간과 노력을 절약합니다.
* 향상된 분석 : 주석, 예측 및 관계는 더 깊은 분석과 이해를 용이하게합니다.
* 다양한 데이터의 통합 : 보조 데이터베이스는 종종 여러 소스의 정보를 통합하여 포괄적 인 관점을 제공합니다.
* 표준화 된 형식 : 데이터는 일반적으로 표준화 된 형식으로 제시되며 일관성과 호환성을 촉진합니다.
올바른 데이터베이스 선택 :
보조 데이터베이스의 선택은 특정 연구 질문 및 데이터 유형에 따라 다릅니다. 다음을 고려하십시오.
* 데이터 유형 : 단백질 서열, 게놈 데이터, 유전자 발현 등
* 범위 : 특정 유기체, 경로, 질병 또는 더 넓은 생물학적 도메인.
* 정보가 필요하다 : 주석, 예측, 상호 작용 등
* 데이터 품질 및 신뢰성 : 데이터베이스가 잘 관리되어 있고 정확한 정보를 제공하는지 확인하십시오.
요약 :
2 차 데이터베이스는 생물 정보학 연구에 필수적입니다. 그들은 효율적인 데이터 분석 및 이해를 용이하게하는 귀중한 미리 컴퓨터 정보, 주석 및 통찰력을 제공합니다. 연구 요구에 따라 올바른 데이터베이스를 선택하고 의미있는 발견을위한 잠재력을 활용하십시오.