Skip to content

Latest commit

 

History

History
208 lines (175 loc) · 25 KB

README.md

File metadata and controls

208 lines (175 loc) · 25 KB

빅바이오

스터디 정보

빅데이터을 활용한 바이오인포매틱스 + 통계기초 + 딥러닝 실습에 대한 스터디입니다.

공유폴더

https://drive.google.com/drive/folders/0B6bSLTlVnagfTFJqV0dwRGdGMWs

교재 정보

참고 자료

데이터 분석 실습

데이터 분석 실습용 데이터

  • 공유폴더 > 빅바이오 > 참고자료 > 학습용 데이터
  • mrna_20160125-200855_type1_00.pkl.gz 와 같은 파일이 24개, 전체 용량 700MB

장소

  1. 장소: 토즈 신촌 아트레온토즈점 ( http://www.toz.co.kr/branch/main/index.htm?id=6 )
  2. 매주 화요일, 저녁 7시 30분~10시
  3. 시작: 2016년03월 08일

스터디 공지

Schedule

Part 1.

seq. 날짜 내용 후기
1 2016. 3. 8 (통계기초) Introductory Statistics with R (Chap. 1~2)(이승우) 후기
(딥러닝 실습) Getting Started(남광우) 후기
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 2장(지용기)
2 2016. 3.15 (통계기초) Introductory Statistics with R (Chap. 3~4)(성민경) 후기
(딥러닝 실습) MNIST For ML Beginners의 발표자료(유재용), MNIST For ML Beginners의 코드
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 3장(우륭)
3 2016. 3.22 (통계기초) Introductory Statistics with R (Chap. 5~6), 이론설명(조현선)
(딥러닝 실습) Deep MNIST for Experts, 용어설명(박혜진)
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 4장(이재환)
4 2016. 3.29 (통계기초) Introductory Statistics with R (Chap. 7~8)(서승연) 후기
(통계기초) 7장 실습, 8장실습
(딥러닝 실습) TensorFlow Mechanics 101(박세진)
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 5장(박지환), 참고자료

Part 2.

seq. 날짜 내용 후기
1 2016. 4. 5 (통계기초) Introductory Statistics with R (Chap. 9~10)(이운섭) 후기
(딥러닝 실습) Convolutional Neural Networks(한성국), GuidetoConvolution.pdf, VisualizingCNN.pdf
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 6장(권선민)
2 2016. 4.12 (통계기초) Introductory Statistics with R (Chap. 11)(이승현)
(통계기초) Introductory Statistics with R (Chap. 12)(이승현)
(딥러닝 실습) TensorFlow Serving(손준영)
(딥러닝 실습) TensorFlow Serving(손준영)
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 7장(박혜진)
3 2016. 4.19 (통계기초)Introductory Statistics with R (Chap. 13~14)(서승연)
(딥러닝 실습) Vector Representations of Words(한성국)
(딥러닝 실습) 참고 논문 : DistributedRepresentations, Learning word embeddings efficiently, Efficient Estimation of Word Representations
(빅데이터 기초) 직접 해보는 하둡 프로그래밍 : 8장(우륭)
4 2016. 4.26 (통계기초) Introductory Statistics with R (Chap. 15~16 이론)(유재용)
(통계기초) Introductory Statistics with R (Chap. 15~16 R실습)(유재용)
(딥러닝 실습) Recurrent Neural Networks 이론(지용기)
(딥러닝 실습) RNN 실습, Udacity Word2Vect, Udacity LSTM
(빅데이터 기초) 러닝 스파크(Learning Spark)이론: 1 ~ 2장(박세진)
(빅데이터 기초) 러닝 스파크(Learning Spark)실습: 1 ~ 2장(박세진)

Part 3.

seq. 날짜 내용 후기
1 2016.5.3 (딥러닝 실습) 암 환자의 유전체데이터 및 데이터 변환작업 소개 ( TCGA )(지용기)
(빅데이터 기초) 러닝 스파크(Learning Spark) 이론 : 3장(이승우)
(빅데이터 기초) 러닝 스파크(Learning Spark) 실습 : 3장(이승우)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 4장(박혜진)
2 2016.5.10 (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발( 회귀모형 1, 실습1)(조익연)
(딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발( 회귀모형 1, 실습2)(조익연)
(빅데이터 기초) 러닝 스파크(Learning Spark) 이론 : 5장(손준영)
(빅데이터 기초) 러닝 스파크(Learning Spark) 실습 : 5장(손준영)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 6장(박세진)
3 2016.5.17 (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발( 회귀모형 2)(조익연)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 7장(지용기)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 8장(박혜진)
4 2016.5.24 (딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발(MLP) 이론(한성국)
(딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발(MLP) 코드(한성국)
(딥러닝 실습) TensorFlow을 사용해서 암 환자 유전체에서 암 예측 모델 개발(데이터 변환 및 PCA 활용)(박혜진)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 9장(박세진)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 11장 이론(지용기)
(빅데이터 기초) 러닝 스파크(Learning Spark) : 11장 실습(지용기)

Part 4.

seq. 날짜 내용 후기
1 2016.5.31 (구글 genomics) https://cloud.google.com/genomics/what-is-google-genomics :
What Is Google Genomics?, Pricing and Quotas , Getting Started (이승우)
(빅데이터 유전체 분석) Data Algorithms: 1장 , 2장 : Secondary Sort (박세진)
2 2016.6.7 (구글 genomics) How-to Guide: Analyze Variants Using BigQuery( 조익연 )발표자료
(빅데이터 유전체 분석) Data Algorithms: 5장 Order Inversion ( 박혜진 )
(빅데이터 유전체 분석) 테스트환경 구축
(빅데이터 유전체 분석) Data Algorithms: 6장 Moving Average( 지용기 )
3 2016. 6.14 (구글 genomics) How-to Guide : Installing the Cloud SDK and Genomics Commands(이창언) 발표자료
(빅데이터 유전체 분석) Data Algorithms: 7장 Market Basket Analysis( 박세진)
(빅데이터 유전체 분석) Data Algorithms: 8장 Common Friends(지용기 )
4 2016. 6.21 (구글 genomics) How-to Guide : Loading Genomic Variants (Peterpan Kim)발표자료
(빅데이터 유전체 분석) Data Algorithms: 9장 Recommendation Engines Using MapReduce (이승우)
(빅데이터 유전체 분석) Data Algorithms: 9장 보강
(빅데이터 유전체 분석) Data Algorithms: 10장 Content-Based Recommendation: Movies (이창언)

Part 5.

seq. 날짜 내용 후기
1 2016. 6.28 (구글 genomics) Broad Institute GATK on Google Genomics (박세진)
GATK 자료1, GATK 자료2, GATK 자료3
(빅데이터 유전체 분석) Data Algorithms: 11장 Smarter Email Marketing with the Markov Model (박혜진)
(빅데이터 유전체 분석) Data Algorithms: 12장 K-Means Clustering(송원종)
2 2016. 7. 5 (구글 genomics) Running Custom Pipelines 발표자료 (이승우)
(빅데이터 유전체 분석) Data Algorithms: 13장 k-Nearest Neighbors(이창언)
(빅데이터 유전체 분석) Data Algorithms: 14장 Naive Bayes(지용기)
3 2016. 7.12 (구글 genomics) Google Genomics Public Data
full list of published data정리, 3가지 access방법에 대한 예제 보여주기 (손준영)
(빅데이터 유전체 분석) Data Algorithms: 15장 Sentiment Analysis (송원종)
(빅데이터 유전체 분석) Data Algorithms: 16장 Finding, Counting, and Listing All Triangles in Large Graphs (지용기)
4 2016. 7.19 (구글 genomics)Docs » Process Data on Google Cloud » Run workflows and common tasks in parallel (손준영)
(빅데이터 유전체 분석) Data Algorithms: 17장 K-mer Counting (지용기)
(빅데이터 유전체 분석) Data Algorithms: 18장 DNA Sequencing (김가경)

Part 6. => 진행하지 않고 종강함. 아래 내용은 R바이오에 포함됨.

seq. 날짜 내용 후기
1 2016. x.xx (구글 genomics)Docs » Process Data on Google Cloud » Create a Grid Engine cluster on Compute Engine
(빅데이터 유전체 분석) Data Algorithms: 19장 Cox Regression
(빅데이터 유전체 분석) Data Algorithms: 20장 Cochran-Armitage Test for Trend
2 2016. x.xx (구글 genomics)Docs » Process Data on Google Cloud » Create a Grid Engine cluster with Preemptible VM workers
(빅데이터 유전체 분석) Data Algorithms: 21장 Allelic Frequency
(빅데이터 유전체 분석) Data Algorithms: 22장 The T-Test
3 2016. x.xx (구글 genomics) Docs » Process Data on Google Cloud » Run SAMtools to index BAM files in Cloud Storage
(빅데이터 유전체 분석) Data Algorithms: 23장 Pearson Correlation
(빅데이터 유전체 분석) Data Algorithms: 24장 DNA Base Count
4 2016. x.xx (구글 genomics) Docs » Analyze Data in Google Genomics » Analyze Reads
(빅데이터 유전체 분석) Data Algorithms: 25장 RNA Sequencing
(빅데이터 유전체 분석) Data Algorithms: 26장 Gene Aggregation

스케줄에 없는 구글 genomics 문서들