\newpage
Preparo da base de dados de estudo retrospectivo de complicações após artroplastia total de quadril primária em idosos
Histórico do documento
Versão | Alterações |
---|---|
01 | Versão inicial |
O projeto “Artroplastia total do Quadril em septuagenários, complicações e resultados a curto prazo” identificará ocorrências de complicações após ATQ em pacientes septuagenários quando comparados a pacientes de faixas etárias inferiores. As complicações foram descritas de maneira qualitativa em campo de texto aberto, onde havia a possibilidade de múltiplas observações para um mesmo paciente. Para a análise das ocorrências das complicações, elas precisam ser codificadas como variáveis dicotômicas.
Este relatório técnico descreve como as complicações foram identificadas na base de dados original, em campo de texto aberto, usando expressões regulares.
Limpeza da base de dados e identificação de cada tipo de complicação pós-cirúrgica dos participantes incluídos na base com chaves de busca por expressões regulares.
A base de dados original possuía 21 variáveis coletadas de 926 observações. Depois dos procedimentos de limpeza e seleção a base final contava com 38 variáveis de 926 observações. Nenhuma variável foi removida no preparo da base, e a diferença é composta apenas pelas novas variáveis indicadoras criadas para classificar todas as possíveis complicações em cada participante incluído na base. Nenhuma observação foi excluída como parte dos processos de limpeza de dados.
Expressões regulares permitem fazer buscas em texto por palavras-chave de forma flexível, permitindo considerar variações de grafia, maiúsculas e minúsculas entre outras coisas. Ao definir chaves de busca específicas para cada complicação, é possível identificar a presença da chave de busca no texto original.
Esta estratégia além de flexível também é expansível e permite ampliar a estratégia de busca que objetiva identificar cada complicação alvo. Na seção 4 serão descritas as chaves de busca usadas para identificação de cada uma das complicações listadas na seção 3.1.
Esta análise foi realizada utilizando-se o software R
versão 4.1.2.
Todas as expressões regulares descritas abaixo foram mapeadas ignorando o caso de grafia, isto é, todas funcionam da mesma forma independente se o texto base foi escrito em maiúsculas ou minúsculas.
Chaves de busca:
anemia
Número de identificações: 18
Chaves de busca:
tep
embol
Número de identificações: 2
Chaves de busca:
tev
Número de identificações: 0
Chaves de busca:
tvp
Número de identificações: 5
Chaves de busca:
instab
luxa
soltura
Número de identificações: 10
Chaves de busca:
deisc
Número de identificações: 2
Chaves de busca:
infec
Número de identificações: 34
Chaves de busca:
hidro
eletr[oó]l[íi]t
Número de identificações: 0
Chaves de busca:
delir
Número de identificações: 5
Chaves de busca:
[óo]bito
morte
Número de identificações: 0
Chaves de busca:
itu
Número de identificações: 4
Chaves de busca:
s[ée]p[st]
Número de identificações: 1
Chaves de busca:
pneumonia
Número de identificações: 4
Chaves de busca:
fx
Número de identificações: 3
Chaves de busca:
parest
Número de identificações: 3
A fim de criar um desfecho composto que capturasse o risco de qualquer complicação pós-cirúrgica no curto prazo, foi criada uma nova variável que é positiva se qualquer das complicações identificadas na seção 4.1. Ela é negativa apenas caso nenhuma das complicações individuais tenha ocorrido para aquele paciente.
Número de identificações: 84
A estratégia utilizada neste relatório técnico são flexíveis o suficiente para permitir a identificação de informações alvo com diferentes grafias, incluindo acentuação, erros tipográficos típicos entre outros. Adicionalmente, caso novas chaves se mostrem necessárias, elas podem ser facilmente acrescentadas ao algoritmo de busca para ampliar o escopo da identificação.
A principal limitação desta estratégia pode ser identificada na busca de chaves de texto pré-determinadas para identificar informações alvo. A qualidade do resultado depende do estabelecimento prévio de chaves de busca abrangentes, suficientes e adequadas ao texto alvo.
N/A
N/A
Este documento pode ser obtido no seguinte endereço:
https://philsf-biostat.github.io/SAR-2021-023-LP/
Os dados utilizados neste relatório não podem ser publicados online por questões de sigilo.
prontuario | nome | sexo | data_de_nascimento | dia_da_cirurgia | dia_de_alta | dias_ate_alta | colunas4 | cid | cor | idade | asa | has | dm |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1 | |||||||||||||
2 | |||||||||||||
3 | |||||||||||||
… | |||||||||||||
926 |
Table: Tabela A1 Estrutura da tabela de dados analíticos (continued below)
outras_comorbidades | tabagismo | ex_tabagista | complicacoes | lateralidade | lateralidade_obs | coluna1 | comp_anemia | comp_tep | comp_tev |
---|---|---|---|---|---|---|---|---|---|
Table: Table continues below
comp_tvp | comp_inst | comp_deisc | comp_infec | comp_hidro | comp_delir | comp_obito | comp_itu | comp_sepse | comp_pneumo | comp_fx |
---|---|---|---|---|---|---|---|---|---|---|
Table: Table continues below
comp_parest | comp_qualquer | group |
---|---|---|