Tutorial de instalação do FastQC (Conda)

FastQC logo

Instalação do FastQC com Conda

Fala, galera! Bora instalar o FastQC Ferramenta para avaliar a qualidade de arquivos FASTQ de sequenciamento. rapidinho usando o Conda?

Se você trabalha com bioinformática, logo vai precisar checar a qualidade de dados Métricas como conteúdo GC, qualidade por base, duplicação e presença de adaptadores. antes de rodar suas análises pesadas. O FastQC é aquele que mostra se os seus FASTQs estão ok para seguir em frente. Ele gera relatórios bonitos em HTML e também tabelas de resultados que você pode usar em análises automáticas.

O que você vai precisar antes:

  • Conda: caso ainda não conheça ou não tenha instalado, confira o tutorial de instalação.
  • WSL: se você ainda não usa o Windows Subsystem for Linux, veja o passo a passo aqui.
  • SRA-Tools: necessário para baixar arquivos FASTQ diretamente de bancos públicos como o ENA/SRA. Veja o tutorial aqui.

Neste guia, você vai:

  • Criar um ambiente Conda e instalar o FastQC dentro dele,
  • Entender a função dessa ferramenta,
  • Rodar uma análise de exemplo e visualizar o relatório.

gif


Passo a passo

  1. Instalação
  2. Rodando sua primeira análise

1. Criando o ambiente e instalando o FastQC

Antes de rodar o FastQC, você precisa ter o Conda Gerenciador de pacotes e ambientes para instalar ferramentas de bioinformática. configurado na sua máquina.

Se você já tiver o Conda ou Miniconda instalado, pode pular este passo. Para verificar, rode conda --version no terminal.

O ideal é manter o FastQC em um ambiente isolado, assim você evita conflitos de versão e mantém o sistema organizado. Para criar o ambiente e instalar o FastQC de uma vez, rode:

conda create -n fastqc-env -c bioconda -c conda-forge fastqc -y
conda activate fastqc-env
Esse passo é recomendado porque:
• mantém o ambiente do sistema limpo,
• garante que todos terão as mesmas versões das ferramentas,
• facilita repetir a análise em qualquer máquina.

Depois de ativar o ambiente, confirme se o FastQC está funcionando:

fastqc --version

Saída esperada:

FastQC v0.xx.x


2. Rodando sua primeira análise (FastQC)

Agora que o FastQC está instalado, vamos rodar nossa primeira análise. O FastQC gera relatórios gráficos (HTML) e tabelas (TXT) sobre a qualidade dos seus dados de sequenciamento.

2.1 Criando a estrutura do projeto

Crie uma pasta para organizar o teste e adicione um diretório de dados:

mkdir -p ~/fastqc_tutorial/data
cd ~/fastqc_tutorial

Coloque 1–2 arquivos FASTQ em data/ (ou baixe algum exemplo público).

Não tem arquivos FASTQ em mãos? Sem problema!
Você pode baixar um exemplo pequeno do ENA/SRA, como o SRR34840432.
prefetch SRR34840432 -O data/
Para isso, será necessário usar o SRA-Tools. Caso ainda não conheça ou não tenha instalado, confira o tutorial completo aqui.
Versões antigas do SRA-Tools (ex.: 2.9.x) podem gerar erros de conexão TLS/SSL ao usar prefetch ou fastq-dump. Antes de usar, confira sua versão com:
prefetch -V
Para desinstalar a versão antiga basta digitar:
conda remove sra-tools
Para instalar a versão mais nova no mesmo ambiente basta digitar:
conda install -c bioconda -c conda-forge sra-tools -y

2.2 Rodando o FastQC

Para rodar o FastQC você pode escolher entre duas formas:

  • Usando o curinga * para analisar todos os arquivos FASTQ do diretório:
    mkdir -p results
    fastqc data/*.fastq.gz -o results/
  • Ou indicando diretamente o nome de um arquivo específico:
    fastqc data/SEU_ARQUIVO.fastq.gz -o results/

Em ambos os casos, será criado um diretório results/ com os relatórios. Você terá dois tipos de saída:

  • HTML: relatório interativo com gráficos (abra no navegador).
  • .zip: pacote com os resultados brutos (para análises automáticas).

Para descobrir o caminho exato onde estão os seus arquivos .html, digite no terminal:

pwd

A saída será algo parecido com isto:

FastQC 1

Se você estiver no Windows: Abra o File Explorer e clique no ícone do Linux na barra lateral esquerda. Depois, navegue pelas pastas até chegar em home. A partir daí, siga o caminho mostrado pelo comando pwd para localizar seus relatórios.
Abra o arquivo .html no navegador e confira a qualidade dos seus dados antes de continuar para etapas de trimming, alinhamento ou montagem.
Você ainda não sabe como interpretar os gráficos do FastQC? Não se preocupe! Você pode encontrar a explicação no nosso medium - FASTQC.

Conclusão

“Pão, pão; queijo, queijo”, como diria meu professor de português Alexandre Soares.

Você instalou o FastQC dentro de um ambiente Conda e rodou sua primeira análise em arquivos FASTQ.
A partir de agora, já consegue avaliar a qualidade dos seus dados antes de avançar para etapas mais pesadas, como trimming (TrimGalore!, fastp), alinhamento (BWA, Bowtie2) ou integração dos relatórios com o MultiQC.

Até a próxima!

gif


Se curtiu, dá aquele apoio no LinkedIn e considere um cafézinho ☕ para manter o projeto vivo. Valeu!

Pix: biologolee@gmail.com
Bitcoin: bc1qg7qrfhclzt3sm60en53qv8fmwpuacfaxt5v55k

QR Code


Referências

  1. Documentação oficial do FastQC
  2. Conda
  3. MultiQC