Tutorial de instalação do MultiQC (Conda)
Instalação do MultiQC com Conda
Fala, galera! Depois de rodar ferramentas de controle de qualidade como o FastQC Ferramenta clássica para avaliar a qualidade de arquivos FASTQ. ou o Falco Ferramenta rápida para avaliação em lote de arquivos FASTQ. , você acaba com uma pilha de relatórios separados. Navegar um por um pode ser trabalhoso e pouco prático quando o número de arquivos cresce.
É aí que entra o MultiQC Ferramenta que reúne múltiplos relatórios de bioinformática em um único resumo interativo. . Ele varre automaticamente um diretório inteiro, detecta relatórios de diversas ferramentas de NGS como FastQC, Falco, STAR, Salmon, Bismark, entre muitas outras, e gera um único relatório consolidado em HTML Um painel interativo que resume todos os resultados em um só lugar. .
Ou seja: em vez de abrir dezenas de arquivos diferentes, você tem tudo integrado e visual em um só clique. Resumindo: o MultiQC é como aquele “puxadinho inteligente” que organiza a bagunça dos relatórios espalhados e entrega tudo de forma clara e prática.
O que você vai precisar antes:
- Conda — confira o tutorial de instalação.
- WSL — se você usa Windows, veja o passo a passo.
- Relatórios de qualidade — você vai precisar ter arquivos já processados pelo FastQC ou pelo Falco. O MultiQC não lê arquivos
.fastq.gz
brutos, apenas os relatórios que essas ferramentas geram. Caso ainda não saiba como obtê-los, confira os tutoriais de cada ferramenta.
Neste guia, você vai:
- Criar um ambiente Conda e instalar o MultiQC;
- Rodar sua primeira análise consolidando relatórios do FastQC e do Falco;
- Visualizar os resultados em um relatório interativo.
Passo a passo
1. Criando o ambiente e instalando o MultiQC
O MultiQC é distribuído pelo bioconda, então a instalação é simples.
conda create -n multiqc-env -c bioconda -c conda-forge multiqc -y conda activate multiqc-env
Esse passo é recomendado porque:
• mantém o ambiente do sistema limpo;
• garante que todos terão as mesmas versões das ferramentas;
• facilita repetir a análise em qualquer máquina.
Depois de ativar o ambiente, confirme se o MultiQC está funcionando:
multiqc --version
Saída esperada:
multiqc, version X.X
2. Exemplo com FastQC
Se você já rodou o FastQC, a estrutura de saída padrão contém pastas como sample_fastqc/
ou arquivos *_fastqc.zip
.
O MultiQC reconhece isso automaticamente:
mkdir -p multiqc_report multiqc results/ -o multiqc_report/
results/
: pasta com relatórios gerados pelo FastQC.-o multiqc_report/
: define a pasta onde será salvo o relatório final.
O MultiQC cria um arquivo multiqc_report.html
que pode ser aberto no navegador, reunindo todas as métricas em gráficos interativos.
3. Exemplo com Falco
O Falco gera relatórios compatíveis com o FastQC (fastqc_data.txt
, summary.txt
, fastqc_report.html
).
Porém, por padrão, o MultiQC só reconhece esses arquivos se estiverem no formato do FastQC: dentro de pastas *_fastqc/
(ou como *_fastqc.zip
).
Para corrigir isso você precisa seguir esses passos:
Crie e edite o arquivo multiqc_config.yaml
com o comando:
nano multiqc_config.yaml
Dentro dele, insira o seguinte conteúdo:
sp: fastqc/data: fn: "*_fastqc_data.txt" fastqc/zip: fn: "*_fastqc.zip"
sp:
início da configuração (search patterns) que informa ao MultiQC como localizar arquivos.fastqc/data:
define um grupo chamado “data” para arquivos de saída do FastQC/Falco.fn: "*_fastqc_data.txt"
padrão (glob) que localiza todos os arquivos terminados em_fastqc_data.txt
.fastqc/zip:
define outro grupo, agora para arquivos compactados.fn: "*_fastqc.zip"
padrão que localiza todos os arquivos.zip
de relatórios do FastQC.
No editor nano:
•CTRL + O
e depoisY
para salvar
•CTRL + X
para sair
Depois rode o comando:
multiqc results/ -o multiqc_report/ -c multiqc_config.yaml -m fastqc -v
O MultiQC não lê arquivos .fastq.gz
brutos, apenas relatórios de QC (ex.: FastQC/Falco).
Aponte sempre para as saídas, não para os FASTQ.
Conclusão
Chegamos ao fim! Você montou um ambiente Conda, instalou o MultiQC e aprendeu a transformar relatórios do FastQC e do Falco em um único arquivo interativo.
A grande sacada do MultiQC é a praticidade: ele coleta informações espalhadas e entrega um panorama claro e organizado, pronto para ser discutido com a equipe ou incluído em relatórios científicos.
De agora em diante, sempre que rodar análises de qualidade ou alinhamento, lembre-se: em vez de abrir arquivo por arquivo, basta um comando e você terá a visão completa do projeto.
Até a próxima!
Se curtiu, dá aquele apoio no LinkedIn