Tutorial de instalação do Falco (Conda)
Instalação do Falco com Conda
Fala, pessoal! Quem já precisou lidar com dezenas ou até centenas de arquivos FASTQ sabe
que rodar análise de qualidade em cada um pode virar uma maratona.
É lento, repetitivo e nada prático quando você trabalha em larga escala.
O
Falco
Ferramenta rápida para avaliação em lote de arquivos FASTQ.
surgiu justamente para resolver isso.
Ele é basicamente um: FASTQC turbinado! Gera todos os gráficos de qualidade em formato interativo com
Plotly
Biblioteca que permite zoom, hover e visualização dinâmica nos relatórios HTML.
,
mas aproveitando ao máximo
multicore e clusters
Execução paralela em vários núcleos ou até mesmo em HPC.
.
No final, você tem a mesma profundidade de avaliação que teria com o FastQC, só que
muito mais rápido, com relatórios que podem ser facilmente integrados ao
MultiQC
Ferramenta que junta relatórios de vários programas em um só lugar.
.
Resumindo: se o FastQC é o clássico para controle de qualidade, o Falco é a sua versão turbinada para escala.
O que você vai precisar antes:
- Conda: caso ainda não conheça ou não tenha instalado, confira o tutorial de instalação.
- WSL: se você ainda não usa o Windows Subsystem for Linux, veja o passo a passo aqui.
- SRA-Tools: útil para baixar arquivos FASTQ diretamente de bancos públicos como o ENA/SRA. Veja o tutorial aqui.
Neste guia, você vai:
- Criar um ambiente Conda e instalar o Falco dentro dele,
- Entender a função dessa ferramenta,
- Rodar uma análise de exemplo e visualizar os relatórios.
Passo a passo
1. Criando o ambiente e instalando o Falco
Antes de rodar o Falco, você precisa ter o Conda Gerenciador de pacotes e ambientes para instalar ferramentas de bioinformática. configurado na sua máquina.
Se você já tiver o Conda ou Miniconda instalado, pode pular este passo.
Para verificar, rode conda --version
no terminal.
O ideal é manter o Falco em um ambiente isolado, assim você evita conflitos de versão e mantém o sistema organizado. Para criar o ambiente e instalar o Falco de uma vez, rode:
conda create -n falco-env -c bioconda -c conda-forge falco -y conda activate falco-env
Esse passo é recomendado porque:
• mantém o ambiente do sistema limpo,
• garante que todos terão as mesmas versões das ferramentas,
• facilita repetir a análise em qualquer máquina.
Depois de ativar o ambiente, confirme se o Falco está funcionando:
falco --version
Saída esperada:
falco vX.X.X
2. Rodando sua primeira análise (Falco)
Agora que o Falco está instalado, vamos rodar nossa primeira análise de controle de qualidade. O Falco foi feito para processar muitos FASTQs em paralelo, de forma rápida e escalável e ideal para clusters ou HPC.
2.1 Criando a estrutura do projeto
Crie uma pasta para organizar o teste e adicione um diretório de dados:
mkdir -p ~/falco_tutorial/data cd ~/falco_tutorial
Coloque 1–2 arquivos FASTQ em data/
(ou baixe algum exemplo público com o SRA-Tools).
Não tem arquivos FASTQ em mãos? Sem problema!
Você pode baixar um exemplo pequeno do ENA/SRA, como oSRR34840432
.prefetch SRR34840432 -O data/Para isso, será necessário usar o SRA-Tools. Caso ainda não conheça ou não tenha instalado, confira o tutorial completo aqui.
Versões antigas doSRA-Tools
(ex.: 2.9.x) podem gerar erros de conexão TLS/SSL ao usarprefetch
oufastq-dump
. Antes de usar, confira sua versão com:Para desinstalar a versão antiga basta digitar:prefetch -V
Para instalar a versão mais nova no mesmo ambiente basta digitar:conda remove sra-tools
conda install -c bioconda -c conda-forge sra-tools -y
2.2 Rodando o Falco
Para analisar todos os arquivos FASTQ dentro da pasta data/
, rode:
mkdir -p results falco data/*.fastq.gz -o results/
-o
: diretório de saída onde serão salvos os relatórios.
O Falco irá processar todos os arquivos em paralelo e gerar estatísticas de qualidade em results/
.
Os principais resultados incluem:
- Resumo tabular: métricas por arquivo (número de reads, tamanho médio, distribuição de qualidade, etc.).
- Relatórios individuais: dados básicos de cada FASTQ.
Para consolidar os resultados em um único relatório, utilize o MultiQC.
Você ainda não sabe como interpretar os gráficos do Falco? Não se preocupe! Você pode encontrar a explicação no nosso medium - Falco.
Conclusão
Direto ao ponto: missão cumprida! Você configurou o ambiente Conda, instalou o Falco e rodou sua primeira checagem em arquivos FASTQ. O Falco entra como aquele aliado rápido quando você tem muitos dados para inspecionar de uma vez. E o melhor: seus relatórios podem ser integrados no MultiQC, centralizando tudo em uma visão única e organizada.
Até a próxima!
Se curtiu, dá aquele apoio no LinkedIn e considere um cafézinho ☕ para manter o projeto vivo. Valeu!
Pix: biologolee@gmail.com
Bitcoin: bc1qg7qrfhclzt3sm60en53qv8fmwpuacfaxt5v55k