SAR-2021-023-LP


\newpage

Preparo da base de dados de estudo retrospectivo de complicações após artroplastia total de quadril primária em idosos

Histórico do documento

Versão Alterações
01 Versão inicial

Lista de abreviaturas

Contexto

O projeto “Artroplastia total do Quadril em septuagenários, complicações e resultados a curto prazo” identificará ocorrências de complicações após ATQ em pacientes septuagenários quando comparados a pacientes de faixas etárias inferiores. As complicações foram descritas de maneira qualitativa em campo de texto aberto, onde havia a possibilidade de múltiplas observações para um mesmo paciente. Para a análise das ocorrências das complicações, elas precisam ser codificadas como variáveis dicotômicas.

Este relatório técnico descreve como as complicações foram identificadas na base de dados original, em campo de texto aberto, usando expressões regulares.

Objetivos

Limpeza da base de dados e identificação de cada tipo de complicação pós-cirúrgica dos participantes incluídos na base com chaves de busca por expressões regulares.

Recepção e tratamento dos dados

A base de dados original possuía 21 variáveis coletadas de 926 observações. Depois dos procedimentos de limpeza e seleção a base final contava com 38 variáveis de 926 observações. Nenhuma variável foi removida no preparo da base, e a diferença é composta apenas pelas novas variáveis indicadoras criadas para classificar todas as possíveis complicações em cada participante incluído na base. Nenhuma observação foi excluída como parte dos processos de limpeza de dados.

Metodologia

Variáveis

Complicações listadas no projeto

Outras complicações

Expressões regulares

Expressões regulares permitem fazer buscas em texto por palavras-chave de forma flexível, permitindo considerar variações de grafia, maiúsculas e minúsculas entre outras coisas. Ao definir chaves de busca específicas para cada complicação, é possível identificar a presença da chave de busca no texto original.

Esta estratégia além de flexível também é expansível e permite ampliar a estratégia de busca que objetiva identificar cada complicação alvo. Na seção 4 serão descritas as chaves de busca usadas para identificação de cada uma das complicações listadas na seção 3.1.

Software utilizado

Esta análise foi realizada utilizando-se o software R versão 4.1.2.

Estratégia de busca

Todas as expressões regulares descritas abaixo foram mapeadas ignorando o caso de grafia, isto é, todas funcionam da mesma forma independente se o texto base foi escrito em maiúsculas ou minúsculas.

Complicações individuais

Anemia com necessidade de transfusão sanguínea

Chaves de busca:

Número de identificações: 18

Embolia pulmonar

Chaves de busca:

Número de identificações: 2

Tromboembolismo venoso

Chaves de busca:

Número de identificações: 0

TVP

Chaves de busca:

Número de identificações: 5

Instabilidade (luxação aguda ou crônica)

Chaves de busca:

Número de identificações: 10

Deiscência de ferida

Chaves de busca:

Número de identificações: 2

Infecção pós operatória

Chaves de busca:

Número de identificações: 34

Distúrbios hidroeletrolíticos com repercussão clínica

Chaves de busca:

Número de identificações: 0

Delirium

Chaves de busca:

Número de identificações: 5

Óbito

Chaves de busca:

Número de identificações: 0

ITU

Chaves de busca:

Número de identificações: 4

Sepse

Chaves de busca:

Número de identificações: 1

Pneumonia

Chaves de busca:

Número de identificações: 4

FX

Chaves de busca:

Número de identificações: 3

Parestesia

Chaves de busca:

Número de identificações: 3

Qualquer complicação

A fim de criar um desfecho composto que capturasse o risco de qualquer complicação pós-cirúrgica no curto prazo, foi criada uma nova variável que é positiva se qualquer das complicações identificadas na seção 4.1. Ela é negativa apenas caso nenhuma das complicações individuais tenha ocorrido para aquele paciente.

Número de identificações: 84

Observações e limitações

A estratégia utilizada neste relatório técnico são flexíveis o suficiente para permitir a identificação de informações alvo com diferentes grafias, incluindo acentuação, erros tipográficos típicos entre outros. Adicionalmente, caso novas chaves se mostrem necessárias, elas podem ser facilmente acrescentadas ao algoritmo de busca para ampliar o escopo da identificação.

A principal limitação desta estratégia pode ser identificada na busca de chaves de texto pré-determinadas para identificar informações alvo. A qualidade do resultado depende do estabelecimento prévio de chaves de busca abrangentes, suficientes e adequadas ao texto alvo.

Referências

N/A

Apêndice

Análise exploratória de dados

N/A

Disponibilidade

Este documento pode ser obtido no seguinte endereço:

https://philsf-biostat.github.io/SAR-2021-023-LP/

Dados utilizados

Os dados utilizados neste relatório não podem ser publicados online por questões de sigilo.

prontuario nome sexo data_de_nascimento dia_da_cirurgia dia_de_alta dias_ate_alta colunas4 cid cor idade asa has dm
1                          
2                          
3                          
                         
926                          

Table: Tabela A1 Estrutura da tabela de dados analíticos (continued below)

outras_comorbidades tabagismo ex_tabagista complicacoes lateralidade lateralidade_obs coluna1 comp_anemia comp_tep comp_tev
                   
                   
                   
                   
                   

Table: Table continues below

comp_tvp comp_inst comp_deisc comp_infec comp_hidro comp_delir comp_obito comp_itu comp_sepse comp_pneumo comp_fx
                     
                     
                     
                     
                     

Table: Table continues below

comp_parest comp_qualquer group