Tutorial de instalação do MultiQC (Conda)

MultiQC logo

Instalação do MultiQC com Conda

Fala, galera! Depois de rodar ferramentas de controle de qualidade como o FastQC Ferramenta clássica para avaliar a qualidade de arquivos FASTQ. ou o Falco Ferramenta rápida para avaliação em lote de arquivos FASTQ. , você acaba com uma pilha de relatórios separados. Navegar um por um pode ser trabalhoso e pouco prático quando o número de arquivos cresce.

É aí que entra o MultiQC Ferramenta que reúne múltiplos relatórios de bioinformática em um único resumo interativo. . Ele varre automaticamente um diretório inteiro, detecta relatórios de diversas ferramentas de NGS como FastQC, Falco, STAR, Salmon, Bismark, entre muitas outras, e gera um único relatório consolidado em HTML Um painel interativo que resume todos os resultados em um só lugar. .

Ou seja: em vez de abrir dezenas de arquivos diferentes, você tem tudo integrado e visual em um só clique. Resumindo: o MultiQC é como aquele “puxadinho inteligente” que organiza a bagunça dos relatórios espalhados e entrega tudo de forma clara e prática.


O que você vai precisar antes:

  • Conda — confira o tutorial de instalação.
  • WSL — se você usa Windows, veja o passo a passo.
  • Relatórios de qualidade — você vai precisar ter arquivos já processados pelo FastQC ou pelo Falco. O MultiQC não lê arquivos .fastq.gz brutos, apenas os relatórios que essas ferramentas geram. Caso ainda não saiba como obtê-los, confira os tutoriais de cada ferramenta.

Neste guia, você vai:

  • Criar um ambiente Conda e instalar o MultiQC;
  • Rodar sua primeira análise consolidando relatórios do FastQC e do Falco;
  • Visualizar os resultados em um relatório interativo.

gif


Passo a passo

  1. Instalação
  2. Rodando com FastQC
  3. Rodando com Falco

1. Criando o ambiente e instalando o MultiQC

O MultiQC é distribuído pelo bioconda, então a instalação é simples.

conda create -n multiqc-env -c bioconda -c conda-forge multiqc -y
conda activate multiqc-env
Esse passo é recomendado porque:
• mantém o ambiente do sistema limpo;
• garante que todos terão as mesmas versões das ferramentas;
• facilita repetir a análise em qualquer máquina.

Depois de ativar o ambiente, confirme se o MultiQC está funcionando:

multiqc --version

Saída esperada:

multiqc, version X.X

2. Exemplo com FastQC

Se você já rodou o FastQC, a estrutura de saída padrão contém pastas como sample_fastqc/ ou arquivos *_fastqc.zip. O MultiQC reconhece isso automaticamente:

mkdir -p multiqc_report
multiqc results/ -o multiqc_report/
  • results/: pasta com relatórios gerados pelo FastQC.
  • -o multiqc_report/: define a pasta onde será salvo o relatório final.

O MultiQC cria um arquivo multiqc_report.html que pode ser aberto no navegador, reunindo todas as métricas em gráficos interativos.

MultiQC 1


3. Exemplo com Falco

O Falco gera relatórios compatíveis com o FastQC (fastqc_data.txt, summary.txt, fastqc_report.html). Porém, por padrão, o MultiQC só reconhece esses arquivos se estiverem no formato do FastQC: dentro de pastas *_fastqc/ (ou como *_fastqc.zip).

Para corrigir isso você precisa seguir esses passos:

Crie e edite o arquivo multiqc_config.yaml com o comando:

nano multiqc_config.yaml

Dentro dele, insira o seguinte conteúdo:

sp:
  fastqc/data:
    fn: "*_fastqc_data.txt"
  fastqc/zip:
    fn: "*_fastqc.zip"
  • sp: início da configuração (search patterns) que informa ao MultiQC como localizar arquivos.
  • fastqc/data: define um grupo chamado “data” para arquivos de saída do FastQC/Falco.
  • fn: "*_fastqc_data.txt" padrão (glob) que localiza todos os arquivos terminados em _fastqc_data.txt.
  • fastqc/zip: define outro grupo, agora para arquivos compactados.
  • fn: "*_fastqc.zip" padrão que localiza todos os arquivos .zip de relatórios do FastQC.
No editor nano:
CTRL + O e depois Y para salvar
CTRL + X para sair

Depois rode o comando:

multiqc results/ -o multiqc_report/ -c multiqc_config.yaml -m fastqc -v
O MultiQC não lê arquivos .fastq.gz brutos, apenas relatórios de QC (ex.: FastQC/Falco). Aponte sempre para as saídas, não para os FASTQ.

Conclusão

Chegamos ao fim! Você montou um ambiente Conda, instalou o MultiQC e aprendeu a transformar relatórios do FastQC e do Falco em um único arquivo interativo.

A grande sacada do MultiQC é a praticidade: ele coleta informações espalhadas e entrega um panorama claro e organizado, pronto para ser discutido com a equipe ou incluído em relatórios científicos.

De agora em diante, sempre que rodar análises de qualidade ou alinhamento, lembre-se: em vez de abrir arquivo por arquivo, basta um comando e você terá a visão completa do projeto.

Até a próxima!

gif

Se curtiu, dá aquele apoio no LinkedIn


Referências

  1. MultiQC — site oficial