Wednesday, November 10, 2010

blast+ 설치 뒤 DB 땜에 group관리

biopython에 빠져서 blast 모듈도 써볼려는 요량에 hanil 서버에다가 blast를 까는데...
어머.. blast가 변했다.. blast+라고 해서 기존의 blast를 c++를 이용해서 다시 만들고 뭐 이것저것 추가 한거 같은데.. 여튼 역시 프로그램 install은 피곤해.. 
이것 저것 알아보고 한 결과(사실 예전의 blast 까는거 보다 매우 쉽다.).
위의 사이트에 나온데로 하면 local하게 깔수 있고 아니면
http://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Web&PAGE_TYPE=BlastDocs&DOC_TYPE=Download
root 계정에서 rpm -ivh으로 깔면 전부 사용가능하게 깔수 있고 주의 할점은 DB의 위치를 셋팅해햐 하는데 위 웹사이트 나온데요 home 디렉토리에 .ncbirc 를 만들고 db의 위치를 넣어주면 된다.

문제는 db 보통 customize db 아니라면 가장 많이 쓰는게 nr, nt인데(blast+ 패키지 안에 update_blastdb.pl 이용하면 편하게 download 가능) 이게 용량이 많은 관계로 한곳에다가 받아서 여러 사용자가 동시에 사용 가능하게 해야 하는데.. 그룹관리를 전혀 안해본 나로는.. 아.. 해봐야 하는 수 밖에 
위사이트가 그래도 좀 나와있다. 

그리고.. blast+가 blast 보다 나은점. blast+에서 blastn이 megablast로 되어있는데.. 이또한 기본 blastn과 다른점이 무엇인지 확인해 봐야겠네...... 

만화로 쉽게 배우는 회귀 분석

대박 아이템 하나 얻었다. 웹에서 이것저것 떠돌다가 얻어걸린 책. 평이 괜찮길래, 사봤는데. 헐.. 학부때 통계학 책은 버렸으면 한다. 우선 이거 부터 읽고 다음 일반적인 통계학 책을 읽기를 추천한다. 정말 쉽게 배울 수 있다. 어려운 부분은 저자가 알아서 스킵하고 큰 틀과 컨샙을 얻어갈수 있도록 정말 배려 많이 한 책이다. 강추다.
책의 처음 장은 그냥 거의 고등학교 때 내용을 아주 기초적으로 설명한다. 그리고 회귀 분석을 그 다음에 여러가지 요인으로 부터 수치를 예측 하는 중회귀 분석, 그뒤 확률의 예측인 로지스틱회귀분석까지 알기 쉬운 예제와 설명으로 구성되어 있다.
원래 저자는 일본인인데... 무서운 일본인들.. 이런 책 은근 많다. 뉴튼 시리즈도 사실 일본에서 나온거고.. 어려운 컨셉을 쉽게 설명하는류의 책이 많다.