Monday, September 6, 2010

essential utility (cvs)

아무래도 cvs를 이용하게 될지모른다는 기분좋은 예감이 든다. 그래서 cvs 에 대해 정리하려 한다.


CVS

-CVS에 의한 프로젝트 파일 버전 관리-

1.CVS 소개

CVS (Concurrent Versions System)는 여러사람이 공동으로 프로젝트를 수행할 때 발생할 수 있는 소스 충돌이나 소스 동기화 문제들을 해결하기 위해서 나왔다. 이는 RCS의 확장에 의해 만들어 졌다.


2.CVS 서버 설정

cvs -v 명령을 내려보면 CVS가 설치되어 있는지 알 수 있다.
없으면 설치하고
프로젝트에서 사용할 프로젝트 파일들을 보관하는 저장소 디렉토리를 생성한다.
mkdir /home/cvs
그뒤 저장소 디렉토리를 초기화한다(초기화란 저장소 디렉토리에 CVS에서 사용하는 제어 파일들이 들어 있는 디렉토리를 생성하는 일).
cvs -d /home/cvs init
cvs 유저를 등록하고 저장소 디렉토리에 대한 접근 권한을 설정한다.
adduser cvs ; chown root.cvs /home/cvs -R ; chmod 770 /home/cvs -R

정리하려 했으나 내가 하려는 것과 완전 똑같은(같은 책을 참조하나 보다) 블로그를 발견하고 링크를 걸고 여기서 정리하기로 한다.
http://blog.naver.com/woorara7?Redirect=Log&logNo=20012018776

high-throughput sequencing data submission to NCBI (GEO, SRA)

The most papers upload their data into GEO or SRA. Therefore, understanding of format which is supported in those databases is needed. Here are links for the format.

soft file format :
http://www.ncbi.nlm.nih.gov/geo/info/soft-seq.html

submitting sequencing data :
http://www.ncbi.nlm.nih.gov/geo/info/seq.html


Why certain NGS data are in SRA database, while some are in GEO :  Whole genome sequencing, metagenome, survey sequencing data and original short read format sequence files belong to SRA database.


SOFT (Simple Omnibus Format in Text) file format is just instruction about submission of data. Actual real data (fastq) can be contained or not.

Tip for checking of inclusion of
1.raw data : if SOFT file contain raw data, there should be "!Sample_raw_file...".
2. processed data : "!Sample_supplementary_file...".