bioinfo-cooper의 등록된 링크

 bioinfo-cooper로 등록된 티스토리 포스트 수는 10건입니다.

[R] R에서 for 반복문 만들기 [내부링크]

R에서도 for문을 이용하여 반복작업을 빠르게 수행할 수 있다. 다양한 함수를 for 구문 안에 집어넣어 반복작업을 효과적으로 돌릴 수 있다. 다음과 같이 할 수 있는데 for(i in 1:5){ print(i) } #print 1 2 3 4 5 데이터 프레임을 대상으로 사용할때는 for 범위를 1:ncol(a), 1:nrow(a) 등으로 사용하여 전체 행이나 열에 대하여 수행할 수도 있다.

[Python] 파이썬으로 fasta 파일 읽기 [내부링크]

파이썬에은 다양한 방법으로 생물정보학 분석에 사용될 수 있다. 그 중 기본적으로 사용될 수 있는 fasta 파일을 읽는 방법을 알아본다. 먼저 fasta 파일은 다음과 같이 >와 함께 나오는 헤더(header)와 시퀀스로 구성되어있다. 내가 필요한 건 주로 시퀀스이기 때문에 코드를 다음과 같이 짤 수 있었다. import re with open("input.fasta") as file: f = file.read().replace("\n","").split(">") st = [] seq = [] for i in range(len(f)): st.append(f[i].replace("Rosalind_","")) st = [v for v in st if v] for i in range(len(st)): seq...

[Linux] bash shell script 반복문 돌리기 | for 루프 [내부링크]

반복 작업을 할 때는 일반적으로 for문을 활용하게 된다. 그 중 가장 많이 쓰이는 방법 중 하나가 for 루프! 리눅스에서는 다음과 같이 사용할 수 있다. for i in {1..10} do echo $i done for문 안을 해야 할 분석이나 script로 채우면 더 다양하게 활용할 수 있다. 디렉토리 안의 파일을 대상으로 for문을 돌려야할 때는 ``기호와 함께 다음과 같이 쓸 수 있다. for i in `ls *` do echo $i done 그럼 ls 의 인자(= 내부 파일)들을 for 루프 안에서 실행하거나 가공하는 등 다양하게 사용할 수 있다.

[R] 외부 인자, 파일 입력 받고 싶을 때 [내부링크]

R에서도 다른 프로그램과 마찬가지로 커맨드라인을 통해 외부 파일을 인자로 입력받을 수 있다. #!/bin/R args = commandArgs(trailingOnly = True) Input = args[1] file

[Linux] 파일의 특정 행만 검색할 때, 특정 부분만 확인할 때 [내부링크]

리눅스 상에서 head 나 tail 말고도 파일 중간의 특정 행을 확인하고 싶을 때가 있다. 방법은 sed 를 이용해서 간단히 볼 수 있다. 만약 test.txt 라는 파일의 5번째 행부터 10번째 행까지 확인하고 싶다면 다음과 같이 확인할 수 있다. sed -n '5,10p' test.txt 이 방법은 라인을 특정지어 확일할 수 있기 때문에 파일을 전체적으로 훑어보고 싶을 때는 more나 less, vim 편집기 등을 이용하는 방법이 있다.

[Linux] 리눅스 디렉토리만 검색하기 [내부링크]

리눅스를 통해 파일을 다루다 보면 디렉토리만 검색해야 할 일이 생긴다. ls -d 뒤에 */ 만 붙여주면 된다. 다른 방법들도 있는데 이 명령어를 사용하는게 가장 간단한 것 같다. ls -d */

[Linux] vim / vi 편집기 텍스트 검색하는 법 [내부링크]

Linux vim 편집기를 이용하다 보면 ctrl + f 와 같은 기능을 사용해야 할 때가 있다. vim / vi 에서는 esc 를 눌러 일반 모드로 진입해야 한다. 그 후, "/"를 입력 후 enter 를 통해 원하는 문자열을 검색할 수 있다. 검색한 텍스트에서 다음 찾기로 넘어가는 것은 n, 이전 찾기로 돌아가는 것은 shift + n 으로 할 수 있다. 예를 들어 다음과 같은 파일을 vim을 통해 만들었을때, "b"라는 문자열을 찾기위해 표준 모드 진입 후 + 찾고자 하는 "b" + enter를 눌러주면 커서가 다음과 같이 이동한다. 다음 문자열을 찾을 때는 n, 이전으로 돌아갈 때는 shift + n 을 눌러주면 된다.

생물정보 취준일기 [내부링크]

생물학과에서 실험할 일도 없으며 이제 핫해진다는 소식을 듣고 대학원을 진학해버린 나.. 생각보다 쉽지 않은 취업시장을 마주하게 되었다. 기업 규모가 큰 곳은 생각보다 많지 않고, 얼마 없는 자리 싸움마저 치열하다는 생각이 들었다. 물론 잘하는 사람들은 그 안에서도 잘하지만.. 앞으로 취업할 때까지 소소한 노력들을 기록하고자 블로그를 개설했다. 부디 6개월 안으로 취준일기를 마무리 할 수 있길..!!

[R] R에서 밀도분포 그리기 (Density plo [내부링크]

밀도분포 그래프란 ( Density plot) 원 데이터의 밀도를 나타낸 그래프이다. 더 부드러워진 히스토그램 느낌. 그러나 히스토그램은 도수나 상대도수, 밀도분포 그래프는 확률분포를 통해 그려진다. 이 밀도 곡선으로 그려지는데 곡선 아래 면적의 합이 1이 된다는 특징이 있다. R에서는 ggplot2 패키지의 geom_density()를 이용하여 간단하게 그릴 수 있다. # iris data 불러오기 data(iris) library(ggplot2) ggplot(data=iris,aes(x=Sepal.Width))+geom_density()