Determinação de um ponto de corte para a identificação de pares verdadeiros pelo método probabilístico de linkage de base de dados

O objetivo deste estudo foi propor pontos de corte nos escores calculados no processo de linkage probabilístico, para as diversas topografias de câncer. Neste estudo foi utilizada a base de dados do RCBP-SP, composta por 343.306 casos incidentes de câncer do município de São Paulo, registrados no pe...

Ausführliche Beschreibung

Gespeichert in:
Bibliographische Detailangaben
Veröffentlicht in:Cadernos saúde coletiva 2014-12, Vol.22 (4), p.428-436
Hauptverfasser: Peres, Stela Verzinhasse, Latorre, Maria do Rosário Dias de Oliveira, Michels, Fernanda Alessandra Silva, Tanaka, Luana Fiengo, Coeli, Claudia Medina, Almeida, Márcia Furquim de
Format: Artikel
Sprache:eng
Online-Zugang:Volltext
Tags: Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
container_end_page 436
container_issue 4
container_start_page 428
container_title Cadernos saúde coletiva
container_volume 22
creator Peres, Stela Verzinhasse
Latorre, Maria do Rosário Dias de Oliveira
Michels, Fernanda Alessandra Silva
Tanaka, Luana Fiengo
Coeli, Claudia Medina
Almeida, Márcia Furquim de
description O objetivo deste estudo foi propor pontos de corte nos escores calculados no processo de linkage probabilístico, para as diversas topografias de câncer. Neste estudo foi utilizada a base de dados do RCBP-SP, composta por 343.306 casos incidentes de câncer do município de São Paulo, registrados no período de 1997 a 2005, com idades que variaram de menos um a 106 anos, de ambos os sexos. Para o linkage probabilístico, realizado no programa Reclink III, foram utilizadas a base de dados do PRO-AIM e APAC-SIA/SUS. Foram calculados os valores da área sob a curva, sensibilidade e especificidade para determinar o ponto de corte do escore de maior precisão na identificação dos pares verdadeiros. Na análise das topografias, verificou-se que o ponto de corte no escore 18 apresentou boa acurácia, com valores de sensibilidade que variaram de 73,7 a 96,7% e de especificidade de 98,5 a 99,4%. Conclui-se que, acima do escore 18 encontravam-se quase a totalidade dos pares verdadeiros, enquanto que abaixo deste, menos de 1% dos registros vinculados eram verdadeiros. The aim of this study was to propose cut-off points for scores calculated in the probabilistic record linkage process for several cancer topographies. In this study we used the PBCR-SP database composed of 343,306 incident cancer cases from the municipality of São Paulo, registered from 1997 through 2005, aged from less than one to 106 years, of both sexes. PRO-AIM and APAC-SIA/SUS databases were used to probabilistic record linkage using Reclink III software. Area under the curve, sensitivity and specificity values were calculated to determine the cut-off point with the highest accuracy in identifying true matches. In the topography analyses, it was found that the cut-off at score 18 showed good accuracy, with sensitivity ranging from 73.7 to 96.7% and specificity ranging from 98.5 to 99.4%. We concluded that above score 18 nearly all true pairs were found. Whereas, below this cut-off, less than 1% of linked records were true matches.
doi_str_mv 10.1590/1414-462X201400040017
format Article
fullrecord <record><control><sourceid>crossref</sourceid><recordid>TN_cdi_crossref_primary_10_1590_1414_462X201400040017</recordid><sourceformat>XML</sourceformat><sourcesystem>PC</sourcesystem><sourcerecordid>10_1590_1414_462X201400040017</sourcerecordid><originalsourceid>FETCH-crossref_primary_10_1590_1414_462X2014000400173</originalsourceid><addsrcrecordid>eNqdj01KxEAQhRtxwKBzBKEuEO3q6Rhn7Q8ewMXsQiVdkWaSdNPdCt7Ae7gQF54iFzMJ4oBLF8V78N5X8IQ4R3mBxVZeokad6yu1UxK1lHI6LI9EpjbFda62uDsW2W_nRKxjtLVUqiwLjZiJt1tOHHo70PgxvjswDM89eDekxTcuJAZPgYDAGh6SbW1z6E4JR3jhYMiwDS6C585BP34mZxz44GqqbTd-xWSbhejssKcnnm1NcdGJdfFMrFrqIq9_9FQU93ePNw95M32NgdvKB9tTeK1QVvPyal5V_V2--S_3DSYfZz8</addsrcrecordid><sourcetype>Aggregation Database</sourcetype><iscdi>true</iscdi><recordtype>article</recordtype></control><display><type>article</type><title>Determinação de um ponto de corte para a identificação de pares verdadeiros pelo método probabilístico de linkage de base de dados</title><source>DOAJ Directory of Open Access Journals</source><source>Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals</source><source>ProQuest Central</source><creator>Peres, Stela Verzinhasse ; Latorre, Maria do Rosário Dias de Oliveira ; Michels, Fernanda Alessandra Silva ; Tanaka, Luana Fiengo ; Coeli, Claudia Medina ; Almeida, Márcia Furquim de</creator><creatorcontrib>Peres, Stela Verzinhasse ; Latorre, Maria do Rosário Dias de Oliveira ; Michels, Fernanda Alessandra Silva ; Tanaka, Luana Fiengo ; Coeli, Claudia Medina ; Almeida, Márcia Furquim de</creatorcontrib><description>O objetivo deste estudo foi propor pontos de corte nos escores calculados no processo de linkage probabilístico, para as diversas topografias de câncer. Neste estudo foi utilizada a base de dados do RCBP-SP, composta por 343.306 casos incidentes de câncer do município de São Paulo, registrados no período de 1997 a 2005, com idades que variaram de menos um a 106 anos, de ambos os sexos. Para o linkage probabilístico, realizado no programa Reclink III, foram utilizadas a base de dados do PRO-AIM e APAC-SIA/SUS. Foram calculados os valores da área sob a curva, sensibilidade e especificidade para determinar o ponto de corte do escore de maior precisão na identificação dos pares verdadeiros. Na análise das topografias, verificou-se que o ponto de corte no escore 18 apresentou boa acurácia, com valores de sensibilidade que variaram de 73,7 a 96,7% e de especificidade de 98,5 a 99,4%. Conclui-se que, acima do escore 18 encontravam-se quase a totalidade dos pares verdadeiros, enquanto que abaixo deste, menos de 1% dos registros vinculados eram verdadeiros. The aim of this study was to propose cut-off points for scores calculated in the probabilistic record linkage process for several cancer topographies. In this study we used the PBCR-SP database composed of 343,306 incident cancer cases from the municipality of São Paulo, registered from 1997 through 2005, aged from less than one to 106 years, of both sexes. PRO-AIM and APAC-SIA/SUS databases were used to probabilistic record linkage using Reclink III software. Area under the curve, sensitivity and specificity values were calculated to determine the cut-off point with the highest accuracy in identifying true matches. In the topography analyses, it was found that the cut-off at score 18 showed good accuracy, with sensitivity ranging from 73.7 to 96.7% and specificity ranging from 98.5 to 99.4%. We concluded that above score 18 nearly all true pairs were found. Whereas, below this cut-off, less than 1% of linked records were true matches.</description><identifier>ISSN: 1414-462X</identifier><identifier>EISSN: 2358-291X</identifier><identifier>DOI: 10.1590/1414-462X201400040017</identifier><language>eng</language><ispartof>Cadernos saúde coletiva, 2014-12, Vol.22 (4), p.428-436</ispartof><woscitedreferencessubscribed>false</woscitedreferencessubscribed><cites>FETCH-crossref_primary_10_1590_1414_462X2014000400173</cites></display><links><openurl>$$Topenurl_article</openurl><openurlfulltext>$$Topenurlfull_article</openurlfulltext><thumbnail>$$Tsyndetics_thumb_exl</thumbnail><link.rule.ids>314,776,780,860,27901,27902</link.rule.ids></links><search><creatorcontrib>Peres, Stela Verzinhasse</creatorcontrib><creatorcontrib>Latorre, Maria do Rosário Dias de Oliveira</creatorcontrib><creatorcontrib>Michels, Fernanda Alessandra Silva</creatorcontrib><creatorcontrib>Tanaka, Luana Fiengo</creatorcontrib><creatorcontrib>Coeli, Claudia Medina</creatorcontrib><creatorcontrib>Almeida, Márcia Furquim de</creatorcontrib><title>Determinação de um ponto de corte para a identificação de pares verdadeiros pelo método probabilístico de linkage de base de dados</title><title>Cadernos saúde coletiva</title><description>O objetivo deste estudo foi propor pontos de corte nos escores calculados no processo de linkage probabilístico, para as diversas topografias de câncer. Neste estudo foi utilizada a base de dados do RCBP-SP, composta por 343.306 casos incidentes de câncer do município de São Paulo, registrados no período de 1997 a 2005, com idades que variaram de menos um a 106 anos, de ambos os sexos. Para o linkage probabilístico, realizado no programa Reclink III, foram utilizadas a base de dados do PRO-AIM e APAC-SIA/SUS. Foram calculados os valores da área sob a curva, sensibilidade e especificidade para determinar o ponto de corte do escore de maior precisão na identificação dos pares verdadeiros. Na análise das topografias, verificou-se que o ponto de corte no escore 18 apresentou boa acurácia, com valores de sensibilidade que variaram de 73,7 a 96,7% e de especificidade de 98,5 a 99,4%. Conclui-se que, acima do escore 18 encontravam-se quase a totalidade dos pares verdadeiros, enquanto que abaixo deste, menos de 1% dos registros vinculados eram verdadeiros. The aim of this study was to propose cut-off points for scores calculated in the probabilistic record linkage process for several cancer topographies. In this study we used the PBCR-SP database composed of 343,306 incident cancer cases from the municipality of São Paulo, registered from 1997 through 2005, aged from less than one to 106 years, of both sexes. PRO-AIM and APAC-SIA/SUS databases were used to probabilistic record linkage using Reclink III software. Area under the curve, sensitivity and specificity values were calculated to determine the cut-off point with the highest accuracy in identifying true matches. In the topography analyses, it was found that the cut-off at score 18 showed good accuracy, with sensitivity ranging from 73.7 to 96.7% and specificity ranging from 98.5 to 99.4%. We concluded that above score 18 nearly all true pairs were found. Whereas, below this cut-off, less than 1% of linked records were true matches.</description><issn>1414-462X</issn><issn>2358-291X</issn><fulltext>true</fulltext><rsrctype>article</rsrctype><creationdate>2014</creationdate><recordtype>article</recordtype><recordid>eNqdj01KxEAQhRtxwKBzBKEuEO3q6Rhn7Q8ewMXsQiVdkWaSdNPdCt7Ae7gQF54iFzMJ4oBLF8V78N5X8IQ4R3mBxVZeokad6yu1UxK1lHI6LI9EpjbFda62uDsW2W_nRKxjtLVUqiwLjZiJt1tOHHo70PgxvjswDM89eDekxTcuJAZPgYDAGh6SbW1z6E4JR3jhYMiwDS6C585BP34mZxz44GqqbTd-xWSbhejssKcnnm1NcdGJdfFMrFrqIq9_9FQU93ePNw95M32NgdvKB9tTeK1QVvPyal5V_V2--S_3DSYfZz8</recordid><startdate>201412</startdate><enddate>201412</enddate><creator>Peres, Stela Verzinhasse</creator><creator>Latorre, Maria do Rosário Dias de Oliveira</creator><creator>Michels, Fernanda Alessandra Silva</creator><creator>Tanaka, Luana Fiengo</creator><creator>Coeli, Claudia Medina</creator><creator>Almeida, Márcia Furquim de</creator><scope>AAYXX</scope><scope>CITATION</scope></search><sort><creationdate>201412</creationdate><title>Determinação de um ponto de corte para a identificação de pares verdadeiros pelo método probabilístico de linkage de base de dados</title><author>Peres, Stela Verzinhasse ; Latorre, Maria do Rosário Dias de Oliveira ; Michels, Fernanda Alessandra Silva ; Tanaka, Luana Fiengo ; Coeli, Claudia Medina ; Almeida, Márcia Furquim de</author></sort><facets><frbrtype>5</frbrtype><frbrgroupid>cdi_FETCH-crossref_primary_10_1590_1414_462X2014000400173</frbrgroupid><rsrctype>articles</rsrctype><prefilter>articles</prefilter><language>eng</language><creationdate>2014</creationdate><toplevel>online_resources</toplevel><creatorcontrib>Peres, Stela Verzinhasse</creatorcontrib><creatorcontrib>Latorre, Maria do Rosário Dias de Oliveira</creatorcontrib><creatorcontrib>Michels, Fernanda Alessandra Silva</creatorcontrib><creatorcontrib>Tanaka, Luana Fiengo</creatorcontrib><creatorcontrib>Coeli, Claudia Medina</creatorcontrib><creatorcontrib>Almeida, Márcia Furquim de</creatorcontrib><collection>CrossRef</collection><jtitle>Cadernos saúde coletiva</jtitle></facets><delivery><delcategory>Remote Search Resource</delcategory><fulltext>fulltext</fulltext></delivery><addata><au>Peres, Stela Verzinhasse</au><au>Latorre, Maria do Rosário Dias de Oliveira</au><au>Michels, Fernanda Alessandra Silva</au><au>Tanaka, Luana Fiengo</au><au>Coeli, Claudia Medina</au><au>Almeida, Márcia Furquim de</au><format>journal</format><genre>article</genre><ristype>JOUR</ristype><atitle>Determinação de um ponto de corte para a identificação de pares verdadeiros pelo método probabilístico de linkage de base de dados</atitle><jtitle>Cadernos saúde coletiva</jtitle><date>2014-12</date><risdate>2014</risdate><volume>22</volume><issue>4</issue><spage>428</spage><epage>436</epage><pages>428-436</pages><issn>1414-462X</issn><eissn>2358-291X</eissn><abstract>O objetivo deste estudo foi propor pontos de corte nos escores calculados no processo de linkage probabilístico, para as diversas topografias de câncer. Neste estudo foi utilizada a base de dados do RCBP-SP, composta por 343.306 casos incidentes de câncer do município de São Paulo, registrados no período de 1997 a 2005, com idades que variaram de menos um a 106 anos, de ambos os sexos. Para o linkage probabilístico, realizado no programa Reclink III, foram utilizadas a base de dados do PRO-AIM e APAC-SIA/SUS. Foram calculados os valores da área sob a curva, sensibilidade e especificidade para determinar o ponto de corte do escore de maior precisão na identificação dos pares verdadeiros. Na análise das topografias, verificou-se que o ponto de corte no escore 18 apresentou boa acurácia, com valores de sensibilidade que variaram de 73,7 a 96,7% e de especificidade de 98,5 a 99,4%. Conclui-se que, acima do escore 18 encontravam-se quase a totalidade dos pares verdadeiros, enquanto que abaixo deste, menos de 1% dos registros vinculados eram verdadeiros. The aim of this study was to propose cut-off points for scores calculated in the probabilistic record linkage process for several cancer topographies. In this study we used the PBCR-SP database composed of 343,306 incident cancer cases from the municipality of São Paulo, registered from 1997 through 2005, aged from less than one to 106 years, of both sexes. PRO-AIM and APAC-SIA/SUS databases were used to probabilistic record linkage using Reclink III software. Area under the curve, sensitivity and specificity values were calculated to determine the cut-off point with the highest accuracy in identifying true matches. In the topography analyses, it was found that the cut-off at score 18 showed good accuracy, with sensitivity ranging from 73.7 to 96.7% and specificity ranging from 98.5 to 99.4%. We concluded that above score 18 nearly all true pairs were found. Whereas, below this cut-off, less than 1% of linked records were true matches.</abstract><doi>10.1590/1414-462X201400040017</doi></addata></record>
fulltext fulltext
identifier ISSN: 1414-462X
ispartof Cadernos saúde coletiva, 2014-12, Vol.22 (4), p.428-436
issn 1414-462X
2358-291X
language eng
recordid cdi_crossref_primary_10_1590_1414_462X201400040017
source DOAJ Directory of Open Access Journals; Elektronische Zeitschriftenbibliothek - Frei zugängliche E-Journals; ProQuest Central
title Determinação de um ponto de corte para a identificação de pares verdadeiros pelo método probabilístico de linkage de base de dados
url https://sfx.bib-bvb.de/sfx_tum?ctx_ver=Z39.88-2004&ctx_enc=info:ofi/enc:UTF-8&ctx_tim=2025-01-28T18%3A59%3A03IST&url_ver=Z39.88-2004&url_ctx_fmt=infofi/fmt:kev:mtx:ctx&rfr_id=info:sid/primo.exlibrisgroup.com:primo3-Article-crossref&rft_val_fmt=info:ofi/fmt:kev:mtx:journal&rft.genre=article&rft.atitle=Determina%C3%A7%C3%A3o%20de%20um%20ponto%20de%20corte%20para%20a%20identifica%C3%A7%C3%A3o%20de%20pares%20verdadeiros%20pelo%20m%C3%A9todo%20probabil%C3%ADstico%20de%20linkage%20de%20base%20de%20dados&rft.jtitle=Cadernos%20sa%C3%BAde%20coletiva&rft.au=Peres,%20Stela%20Verzinhasse&rft.date=2014-12&rft.volume=22&rft.issue=4&rft.spage=428&rft.epage=436&rft.pages=428-436&rft.issn=1414-462X&rft.eissn=2358-291X&rft_id=info:doi/10.1590/1414-462X201400040017&rft_dat=%3Ccrossref%3E10_1590_1414_462X201400040017%3C/crossref%3E%3Curl%3E%3C/url%3E&disable_directlink=true&sfx.directlink=off&sfx.report_link=0&rft_id=info:oai/&rft_id=info:pmid/&rfr_iscdi=true