RICOPILI stands for Rapid Imputation and COmputational PIpeLIne for GWAS.
The software consists of four independent modules: Preimputation (QC), PCA, Imputation, and Meta-Analysis. These modules are not meant to be used linearly. For example, it may be necessary to repeat QC after discovering your data contains multiple populations from PCA.
$RICOPILI_TEST_DATA/ricopili.conf
$RICOPILI_TEST_DATA/log
$RICOPILI_TEST_DATA
Allocate an interactive session and run the program.
Sample session (user input in bold):
[user@biowulf]$ sinteractive --mem=12g --cpus-per-task=24 salloc.exe: Pending job allocation 46116226 salloc.exe: job 46116226 queued and waiting for resources salloc.exe: job 46116226 has been allocated resources salloc.exe: Granted job allocation 46116226 salloc.exe: Waiting for resource configuration salloc.exe: Nodes cn3144 are ready for job [user@cn3144]$ module load ricopili [user@cn3144]$ cp $RICOPILI_TEST_DATA/ricopili.conf ~/ [user@cn3144]$ mkdir -p ~/ricopili; cp -r $RICOPILI_TEST_DATA/log ~/ricopili/ [user@cn3144]$ mkdir -p /data/$USER/ricopili [user@cn3144]$ cd /data/$USER/ricopili/; tar -zxvf $RICOPILI_TEST_DATA/test_sample.tar.gz [user@cn3144]$ cd test_samle [user@cn3144]$ preimp_dir --disease sim --outname hapgen_5cohorts switched on SERIAL mode because of configuration file _ _ _ _ _ __(_) ___ ___ _ __ (_) (_) | '__| |/ __/ _ \| '_ \| | | | | | | | (_| (_) | |_) | | | | |_| |_|\___\___/| .__/|_|_|_| |_| ####################################################################### ####################################################################### ## ### ## preimp_dir - module of ricopili pipeline ### ## version: 2019_Jun_25.001 ### ## ### ## https://sites.google.com/a/broadinstitute.org/ricopili/home ### ## Stephan Ripke: sripke@broadinstitute.org ### ## ### ####################################################################### ####################################################################### Running job: plague switched on SERIAL mode because of configuration file _ _ _ _ _ __(_) ___ ___ _ __ (_) (_) | '__| |/ __/ _ \| '_ \| | | | | | | | (_| (_) | |_) | | | | |_| |_|\___\___/| .__/|_|_|_| |_| ####################################################################### ####################################################################### ## ### ## preimp_dir - module of ricopili pipeline ### ## version: 2019_Jun_25.001 ### ## ### ## https://sites.google.com/a/broadinstitute.org/ricopili/home ### ## Stephan Ripke: sripke@broadinstitute.org ### ## ### ####################################################################### ####################################################################### Running job: qc ----------------------------------------------------- switched on SERIAL mode because of configuration file _ _ _ _ _ __(_) ___ ___ _ __ (_) (_) | '__| |/ __/ _ \| '_ \| | | | | | | | (_| (_) | |_) | | | | |_| |_|\___\___/| .__/|_|_|_| |_| ####################################################################### ####################################################################### ## ### ## preimp_dir - module of ricopili pipeline ### ## version: 2019_Jun_25.001 ### ## ### ## https://sites.google.com/a/broadinstitute.org/ricopili/home ### ## Stephan Ripke: sripke@broadinstitute.org ### ## ### ####################################################################### ####################################################################### Running job: finished ################################################################## ##### CONGRATULATIONS: ##### preimp_pipeline finished successfully: ##### preimp_dir --disease sim --outname hapgen_5cohorts ##### now start with imputation pipeline (see README in subdir qc/) ##### have a look at the wiki page ##### https://sites.google.com/a/broadinstitute.org/ricopili/ ################################################################## [user@cn3144]$ cd qc [user@cn3144]$ pcaer --prefercase --preferfam --out pca_hap1a sim_sim5_eur_yourini-qc1.bim ---------------------------------------------------- witched on SERIAL mode because of configuration file _ _ _ _ _ __(_) ___ ___ _ __ (_) (_) | '__| |/ __/ _ \| '_ \| | | | | | | | (_| (_) | |_) | | | | |_| |_|\___\___/| .__/|_|_|_| |_| ####################################################################### ####################################################################### ## ### ## pcaer - module of ricopili pipeline ### ## version: 2019_Jun_25.001 ### ## ### ## https://sites.google.com/a/broadinstitute.org/ricopili/home ### ## Stephan Ripke: sripke@broadinstitute.org ### ## ### ####################################################################### ####################################################################### Running job: me300 ----------------------------------------------------- Running job: finished [user@cn3144]$ exit salloc.exe: Relinquishing job allocation 46116226 [user@biowulf ~]$
Create a batch input file (e.g. ricopili_run.sh). Remember you still need to set up the config files first. For example:
#!/bin/bash set -e module load ricopili cd /data/$USER/ricopili/test_sample preimp_dir --disease sim --outname hapgen_5cohorts
Submit this job using the Slurm sbatch command.
sbatch --cpus-per-task=24 --mem=12g ricopili_run.sh