Coluna · IA na pesquisa científica

Claude Code para pesquisadores: onde o tutorial avança e onde se cala

Comentário crítico sobre o tutorial de Mushtaq Bilal (PhD) acerca do uso do Claude Code por pesquisadores acadêmicos, com aparato em governança de IA, integridade científica e implicações para a pesquisa em administração no Brasil.

Por Prof. Dr. Diocélio Dornela Goulart · PUC Minas / FDC 9 de maio de 2026 · ≈ 14 min de leitura

Nota editorial Este texto não traduz nem reproduz o material original de Bilal (s.d.). Trata-se de comentário acadêmico autoral, com paráfrase substancial das ideias do tutorial, atribuição explícita e aparato crítico próprio. O leitor que desejar consultar a publicação na íntegra deve recorrer à fonte primária no perfil do autor em X (referência ao final).

A circulação do tutorial de Mushtaq Bilal sobre Claude Code reabriu, no microcosmo das redes acadêmicas, uma discussão que a literatura de governança de IA já tratava com mais cautela: em que medida ferramentas de codificação assistida por modelos de linguagem podem ser apropriadas pelo trabalho científico cotidiano sem comprometer integridade, reprodutibilidade e proteção de dados. O texto de Bilal (s.d.) é didaticamente eficiente. Cumpre o objetivo de retirar o pesquisador do estágio de espectador e colocá-lo diante do terminal. Faz isso com pedagogia clara, em registro acessível, e descreve um conjunto plausível de aplicações para revisão de literatura, análise de transcrições e organização de arquivos.

O que se segue não é uma resenha. É uma leitura crítica de pesquisador para pesquisadores: aproveita o que o tutorial oferece, identifica o que ele suprime e propõe um arranjo de uso que dialogue com as exigências normativas brasileiras (LGPD), com a Lei Geral de Proteção de Dados Pessoais (Brasil, 2018), e com os padrões internacionais de gestão de risco em IA (ISO/IEC, 2023; NIST, 2023).

A diferença entre um assistente de pesquisa e um terceirizador do pensamento não está na ferramenta. Está nas perguntas que o pesquisador consegue, ou não, formular antes de ligá-la.

Parte IO que o tutorial propõe, em síntese

O argumento central de Bilal pode ser condensado em uma reorganização do fluxo de trabalho do pesquisador. Em vez de levar arquivos individuais a uma interface conversacional de IA, o pesquisador instala o Claude Code em sua máquina e abre uma pasta de projeto. O modelo passa a operar dentro dessa pasta, com permissão para ler, editar e criar arquivos, e mantém estado entre sessões por meio de um arquivo de instruções persistentes (CLAUDE.md) e de notas internas de memória.

O tutorial articula esse desenho em cinco módulos cuja síntese parafrástica apresento a seguir, sem reproduzir literalmente o original.

Definição operacional

Claude Code é um aplicativo local que, instalado no computador do pesquisador, opera sobre uma pasta de projeto. Distingue-se das interfaces conversacionais por executar ações sobre arquivos e por preservar contexto entre sessões.

Instalação e primeira sessão

Requer assinatura paga (Pro ou Max) e cerca de quinze a vinte minutos de configuração. O usuário escolhe a pasta do projeto e dialoga com o modelo em painel de chat semelhante ao das interfaces web.

iii

Configuração do assistente

Um arquivo CLAUDE.md em texto simples descreve papel, padrões editoriais, estilo de escrita e modo de crítica. Funciona como instrução permanente lida pelo modelo no início de cada sessão.

Operação sobre documentos

Tarefas demonstradas incluem triagem de artigos por critérios de inclusão, extração de objetivos e métodos a partir de conjuntos de PDFs, codificação preliminar de transcrições e renomeação de arquivos por metadado bibliográfico.

Habilidades (Skills)

Skills são instruções específicas para tarefas recorrentes. Diferem do CLAUDE.md por escopo: um delimita o perfil do projeto; o outro encapsula procedimento técnico a ser invocado pontualmente.

O tutorial encerra com advertência saudável: a ferramenta pode redigir, resumir e codificar, mas o que conta como argumento ou evidência permanece responsabilidade do pesquisador. A advertência é correta. É também breve demais para o peso do problema que enuncia.

Parte IIAparato crítico: quatro eixos

Apresento a seguir quatro eixos de leitura crítica. Não se pretendem exaustivos; pretendem-se necessários. Cada eixo identifica uma omissão ou uma simplificação do tutorial que o pesquisador acadêmico precisa endereçar antes de adotar o Claude Code em fluxos de produção científica.

Codificação automatizada de dados qualitativos: uma decisão metodológica, não uma facilidade

Quando Bilal sugere que o pesquisador peça ao Claude Code para "encontrar todas as vezes que os participantes falaram sobre determinado assunto" e "identificar temas gerais", o que está em jogo não é produtividade, mas escolha epistemológica. A análise temática reflexiva (Braun & Clarke, 2019), a análise de conteúdo (Bardin, 2011) e a Grounded Theory (Charmaz, 2014) operam com pressupostos distintos sobre o papel do analista. Delegar a um modelo de linguagem a etapa de codificação altera, na prática, o método sem alterar a sua declaração no relatório de pesquisa. Isso configura problema de fidedignidade e de transparência metodológica.

A literatura recente sobre uso de LLMs em pesquisa qualitativa registra resultados ambíguos: alguma concordância entre codificação humana e codificação assistida em corpora simples, queda significativa em corpora densos ou de domínio especializado (Morgan, 2023; Sallam, 2023). O pesquisador que adotar Claude Code para essa tarefa deve, no mínimo, declarar a coautoria computacional, preservar trilha de auditoria e validar amostras por dupla codificação humana.

LGPD, ISO/IEC 42001 e NIST AI RMF: o silêncio do tutorial

Transcrições de entrevistas contêm dados pessoais e, com frequência, dados pessoais sensíveis (Brasil, 2018, art. 5º, II). Submetê-las a um sistema de IA externo, ainda que executado localmente, exige base legal explícita, finalidade específica, minimização e, em projetos com risco mais elevado, relatório de impacto à proteção de dados pessoais (RIPD). O tutorial não tematiza nada disso.

A ISO/IEC 42001:2023 estabelece requisitos para sistemas de gestão de IA em organizações, incluindo o registro do propósito do uso, controle sobre fornecedores e gestão do ciclo de vida do modelo (ISO/IEC, 2023). O NIST AI RMF 1.0 organiza essas obrigações em quatro funções (govern, map, measure, manage) e recomenda que o uso de modelos de fronteira em contextos sensíveis seja precedido de avaliação de risco contextual (National Institute of Standards and Technology, 2023). Universidades e centros de pesquisa brasileiros que recebem fomento público têm dever fiduciário sobre os dados de seus participantes; essa obrigação não desaparece quando a IA é instalada na máquina do orientador.

Alucinação e a ausência de protocolo de verificação

O tutorial pressupõe que o pesquisador identificará por conta própria erros do modelo. A literatura sobre alucinação em modelos de linguagem (Ji et al., 2023) demonstra que essa pressuposição é ingênua. Erros de citação, atribuição equivocada de argumentos a autores e fabricação de referências aparecem com frequência e tendem a passar despercebidos quando o usuário confia na aparência de competência do output.

O caso de citações fabricadas em peças jurídicas (Mata v. Avianca, 2023) tornou-se referência cautelar fora do meio acadêmico, mas equivalentes no meio científico já foram documentados (Bender et al., 2021). O pesquisador que pedir ao Claude Code para "extrair argumentos" de quarenta e cinco PDFs precisa de protocolo de verificação amostral, registro de proveniência e checagem cruzada com a fonte primária. Sem isso, a triagem assistida produz um corpus que parece revisão de literatura mas funciona como espelho dos vieses do modelo.

Memória oculta, instruções persistentes e o problema da auditoria

O CLAUDE.md e a memória automática mencionados no tutorial criam um problema de reprodutibilidade que o autor não discute. Dois pesquisadores que operem com a mesma versão do Claude Code sobre o mesmo corpus podem obter resultados diferentes porque seus arquivos de instrução e suas memórias acumuladas diferem. Em pesquisa científica, isso configura variável oculta. A solução mínima é tratar o CLAUDE.md como artefato de pesquisa, versioná-lo em sistema de controle de versões (Git) e depositá-lo em repositório aberto junto com os demais materiais de replicação (Peng, 2011; Stodden et al., 2016).

Parte IIITensões deliberadas que o pesquisador precisa nomear

O ganho de produtividade prometido pelo tutorial existe. Recusá-lo por princípio seria dogmatismo. A questão é que cada ganho carrega contrapartida que não aparece na peça original. Apresento três tensões abaixo, em formato confrontativo, para que o leitor possa decidir caso a caso.

Promessa do tutorial

O Claude Code lê 45 PDFs e extrai objetivos e metodologia de todos eles em minutos.

Contrapartida que o tutorial omite

A extração depende do modelo identificar corretamente seções dos artigos, o que falha sistematicamente em PDFs escaneados, em layouts atípicos e em literatura cinzenta. A tabela final pode ser tão precisa quanto enganosa.

Promessa do tutorial

O modelo lembra do projeto e do estilo do pesquisador entre sessões, evitando reexplicação.

Contrapartida que o tutorial omite

Memória persistente sem registro auditável é fonte de viés acumulado: o modelo aprende a agradar o operador e tende a confirmar hipóteses já formuladas, fenômeno consistente com o efeito de bajulação documentado em modelos atuais (Sharma et al., 2023).

Promessa do tutorial

Pesquisadores qualitativos ganham assistente para identificar temas em transcrições de entrevistas.

Contrapartida que o tutorial omite

O processamento de transcrições com identificadores diretos ou indiretos exige base legal sob a LGPD e contrato de tratamento de dados com o fornecedor da IA. O tutorial não orienta sobre anonimização prévia nem sobre a cláusula contratual aplicável (Brasil, 2018, arts. 7º e 11).

Parte IVRecomendações para o pesquisador brasileiro em administração

Se o leitor se persuadiu da utilidade do Claude Code mas também das ressalvas acima, proponho protocolo mínimo de adoção, alinhado às exigências normativas e aos padrões de pesquisa das principais revistas da área (RAUSP, RAC, BAR, RAE).

Anonimização prévia obrigatória. Toda transcrição submetida ao modelo deve passar por anonimização de identificadores diretos e por pseudonimização de identificadores indiretos. Sem isso, não há base legal sustentável para o tratamento.
CLAUDE.md como artefato versionado. O arquivo de instruções persistentes deve ser tratado como dado de pesquisa, mantido em repositório Git e depositado, ao final do projeto, em repositório aberto (OSF, Zenodo) junto aos demais materiais de replicação.
Protocolo de verificação amostral. Para qualquer tarefa de extração ou codificação assistida, defina taxa de verificação humana (tipicamente 10–20% do corpus) e registre concordância. Resultados abaixo de κ = 0,70 indicam necessidade de revisão completa (Cohen, 1960; Landis & Koch, 1977).
Declaração de coautoria computacional. Em manuscritos submetidos à publicação, declare o uso do Claude Code, o escopo das tarefas delegadas e o protocolo de verificação adotado, conforme orientações da COPE (2023) e da diretriz editorial da maioria das revistas indexadas em Scopus e Web of Science.
Avaliação de risco contextual. Antes de usar o Claude Code em projeto envolvendo dados pessoais sensíveis ou propriedade intelectual de terceiros, conduza avaliação informada pelo NIST AI RMF (2023) e, em projetos institucionais, articule-se com o encarregado de proteção de dados (DPO) da instituição.
Reserva metodológica em estudos qualitativos. Em pesquisas que se reivindiquem fenomenológicas, reflexivas ou de Grounded Theory construtivista, evite delegar a codificação ao modelo. O método é incompatível com a delegação. A ferramenta pode auxiliar em tarefas adjacentes (organização de corpus, geração de memos preliminares), não na operação central de análise.

Parte VConsiderações finais sem fechamento prematuro

O tutorial de Bilal cumpre o que promete: introduz o pesquisador ao Claude Code com pedagogia clara. Sua omissão sobre governança, integridade e reprodutibilidade não decorre de má-fé, e sim do gênero do texto, formato curto de mídia social, refratário a aparato. O problema surge quando a peça circula em ambientes acadêmicos como se fosse autossuficiente.

Não é possível afirmar com os dados disponíveis que o uso do Claude Code, sob protocolo adequado, comprometa a qualidade da pesquisa em administração. Tampouco é possível afirmar o contrário sem evidência empírica longitudinal. O que se pode dizer é que a adoção responsável exige tradução institucional do que o tutorial deixa implícito: políticas de uso, treinamento em integridade computacional e revisão das diretrizes editoriais das revistas brasileiras da área.

Para pesquisadores que trabalham na intersecção entre transformação digital e gestão da inovação, o caso é interessante por motivo adicional. A ferramenta materializa, no fluxo de trabalho individual, tensões que Chesbrough (2003) identificou em escala organizacional sob o nome de inovação aberta: o conhecimento que entra no projeto deixa de ser totalmente endógeno, e o pesquisador precisa decidir o que abre, o que protege e o que devolve em forma de método replicável. O Claude Code não é apenas um aplicativo. É, em escala micro, um caso de gestão de conhecimento aberto que reproduz, no laboratório, perguntas que o pesquisador talvez já estude no campo.

Resta uma observação final, em registro pessoal. Tenho usado o Claude Code em projetos de governança e auditoria, com protocolos próximos ao recomendado acima. O ganho operacional é real. A tentação de pular etapas de verificação também. A diferença entre o assistente confiável e a fonte de erro silenciosa não está na ferramenta, e sim na disciplina metodológica que o pesquisador conserva diante dela.

Referências

Bardin, L. (2011). Análise de conteúdo (L. A. Reto & A. Pinheiro, Trads.). Edições 70.
Bender, E. M., Gebru, T., McMillan-Major, A., & Shmitchell, S. (2021). On the dangers of stochastic parrots: Can language models be too big? In Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency (pp. 610–623). Association for Computing Machinery. https://doi.org/10.1145/3442188.3445922
Bilal, M. [@MushtaqBilalPhD]. (s.d.). Tutorial em cinco partes sobre Claude Code para pesquisadores acadêmicos [Post]. X. https://x.com/mushtaqbilalphd/status/2052338632426467550
Brasil. (2018, 14 de agosto). Lei nº 13.709, de 14 de agosto de 2018. Lei Geral de Proteção de Dados Pessoais (LGPD). Diário Oficial da União. http://www.planalto.gov.br/ccivil_03/_ato2015-2018/2018/lei/l13709.htm
Braun, V., & Clarke, V. (2019). Reflecting on reflexive thematic analysis. Qualitative Research in Sport, Exercise and Health, 11(4), 589–597. https://doi.org/10.1080/2159676X.2019.1628806
Charmaz, K. (2014). Constructing grounded theory (2nd ed.). SAGE.
Chesbrough, H. W. (2003). Open innovation: The new imperative for creating and profiting from technology. Harvard Business School Press.
Cohen, J. (1960). A coefficient of agreement for nominal scales. Educational and Psychological Measurement, 20(1), 37–46. https://doi.org/10.1177/001316446002000104
Committee on Publication Ethics. (2023). Authorship and AI tools: COPE position statement. https://publicationethics.org/cope-position-statements/ai-author
International Organization for Standardization. (2023). ISO/IEC 42001:2023 — Information technology, artificial intelligence, management system. ISO.
Ji, Z., Lee, N., Frieske, R., Yu, T., Su, D., Xu, Y., Ishii, E., Bang, Y. J., Madotto, A., & Fung, P. (2023). Survey of hallucination in natural language generation. ACM Computing Surveys, 55(12), 1–38. https://doi.org/10.1145/3571730
Landis, J. R., & Koch, G. G. (1977). The measurement of observer agreement for categorical data. Biometrics, 33(1), 159–174. https://doi.org/10.2307/2529310
Morgan, D. L. (2023). Exploring the use of artificial intelligence for qualitative data analysis: The case of ChatGPT. International Journal of Qualitative Methods, 22, 1–10. https://doi.org/10.1177/16094069231211248
National Institute of Standards and Technology. (2023). Artificial intelligence risk management framework (AI RMF 1.0) (NIST AI 100-1). U.S. Department of Commerce. https://doi.org/10.6028/NIST.AI.100-1
Peng, R. D. (2011). Reproducible research in computational science. Science, 334(6060), 1226–1227. https://doi.org/10.1126/science.1213847
Sallam, M. (2023). ChatGPT utility in healthcare education, research, and practice: Systematic review on the promising perspectives and valid concerns. Healthcare, 11(6), 887. https://doi.org/10.3390/healthcare11060887
Sharma, M., Tong, M., Korbak, T., Duvenaud, D., Askell, A., Bowman, S. R., Cheng, N., Durmus, E., Hatfield-Dodds, Z., Johnston, S. R., Kravec, S., Maxwell, T., McCandlish, S., Ndousse, K., Rausch, O., Schiefer, N., Yan, D., Zhang, M., & Perez, E. (2023). Towards understanding sycophancy in language models. arXiv. https://doi.org/10.48550/arXiv.2310.13548
Stodden, V., McNutt, M., Bailey, D. H., Deelman, E., Gil, Y., Hanson, B., Heroux, M. A., Ioannidis, J. P. A., & Taufer, M. (2016). Enhancing reproducibility for computational methods. Science, 354(6317), 1240–1241. https://doi.org/10.1126/science.aah6168

Nota sobre verificação de fontes. As referências foram cotejadas com as bases originais quando possível. A datação do post de Bilal foi marcada como [s.d.] em razão da indisponibilidade de acesso direto à fonte no momento da redação; recomenda-se ao leitor confirmar a data de publicação consultando o perfil do autor. Eventuais discrepâncias devem ser comunicadas para correção em revisão posterior.