Tack för att du besöker Nature.com. Den version av webbläsare du använder har begränsat CSS -stöd. För bästa resultat rekommenderar vi att du använder en nyare version av din webbläsare (eller stänger av kompatibilitetsläge i Internet Explorer). Under tiden, för att säkerställa pågående stöd, visar vi webbplatsen utan styling eller JavaScript.
Tänderna anses vara den mest exakta indikatorn på människokroppens ålder och används ofta i kriminalteknisk bedömning. Vi syftade till att validera data för data mining-baserade tandåldersålder genom att jämföra uppskattningsnoggrannheten och klassificeringsprestanda för den 18-åriga tröskeln med traditionella metoder och data för data mining-baserade ålder. Totalt samlades 2657 panoramiska röntgenbilder från koreanska och japanska medborgare i åldrarna 15 till 23 år. De delades in i en träningsuppsättning, var och en innehållande 900 koreanska röntgenbilder och en intern testuppsättning innehållande 857 japanska röntgenbilder. Vi jämförde klassificeringsnoggrannheten och effektiviteten hos traditionella metoder med testuppsättningar av data mining -modeller. Noggrannheten för den traditionella metoden på den interna testuppsättningen är något högre än för data mining -modellen, och skillnaden är liten (medelvärde absolut fel <0,21 år, root medelkvadratfel <0,24 år). Klassificeringsprestanda för den 18-åriga avgränsningen är också liknande mellan traditionella metoder och data mining-modeller. Således kan traditionella metoder ersättas av data mining -modeller när man utför kriminalteknisk åldersbedömning med hjälp av mognaden för andra och tredje molar hos koreanska ungdomar och unga vuxna.
Uppskattning av tandålder används ofta i kriminalteknisk medicin och pediatrisk tandvård. I synnerhet, på grund av den höga korrelationen mellan kronologisk ålder och tandutveckling, är åldersbedömning genom tandutvecklingsstadier ett viktigt kriterium för att bedöma åldern för barn och ungdomar1,2,3. För ungdomar har emellertid att uppskatta tandåldern baserad på tandmognad sina begränsningar eftersom tandtillväxten är nästan fullständig, med undantag för de tredje molarna. Det rättsliga syftet med att fastställa ungdomarnas och ungdomars ålder är att ge exakta uppskattningar och vetenskapliga bevis på om de har nått majoritetens ålder. I den medicinska-juridiska praxis för ungdomar och unga vuxna i Korea uppskattades ålder med hjälp av Lees metod, och en laglig tröskel på 18 år förutsågs baserat på de uppgifter som rapporterats av OH et al 5.
Maskininlärning är en typ av konstgjord intelligens (AI) som upprepade gånger lär sig och klassificerar stora mängder data, löser problem på egen hand och driver dataprogrammering. Maskininlärning kan upptäcka användbara dolda mönster i stora volymer data6. Däremot kan klassiska metoder, som är arbetsintensiva och tidskrävande, ha begränsningar när man hanterar stora volymer komplexa data som är svåra att bearbeta manuellt7. Därför har många studier genomförts nyligen med hjälp av de senaste datateknikerna för att minimera mänskliga fel och effektivt bearbeta multidimensionella data8,9,10,11,12. I synnerhet har djup inlärning använts i stor utsträckning i medicinsk bildanalys, och olika metoder för åldersuppskattning genom att automatiskt analysera röntgenbilder har rapporterats förbättra noggrannheten och effektiviteten i åldersberäkningen13,14,15,16,17,18,19,20 . Till exempel utvecklade Halabi et al 13 en maskininlärningsalgoritm baserad på konvolutionella neurala nätverk (CNN) för att uppskatta skelettåldern med hjälp av röntgenbilder av barnens händer. Denna studie föreslår en modell som tillämpar maskininlärning på medicinska bilder och visar att dessa metoder kan förbättra diagnostisk noggrannhet. Li et al14 uppskattade ålder från röntgenbilder med bäcken med hjälp av en djup inlärning CNN och jämförde dem med regressionsresultat med användning av ossifieringssteguppskattning. De fann att den djupa inlärnings -CNN -modellen visade samma åldersuppskattningsprestanda som den traditionella regressionsmodellen. Guo et al .: S studie [15] utvärderade åldertoleransklassificeringsprestanda för CNN -teknik baserad på tandortofotos, och resultaten från CNN -modellen bevisade att människor överträffade sin åldersklassificeringsprestanda.
De flesta studier om åldersuppskattning med hjälp av maskininlärning använder djupa inlärningsmetoder13,14,15,16,17,18,19,20. Åldersberäkning baserad på djup inlärning rapporteras vara mer exakt än traditionella metoder. Detta tillvägagångssätt ger emellertid liten möjlighet att presentera den vetenskapliga grunden för åldersberäkningar, till exempel åldersindikatorerna som används i uppskattningarna. Det finns också en juridisk tvist om vem som genomför inspektioner. Därför är åldersuppskattning baserad på djup inlärning svår att acceptera av administrativa och rättsliga myndigheter. Data Mining (DM) är en teknik som inte bara kan upptäcka utan också oväntad information som en metod för att upptäcka användbara korrelationer mellan stora mängder data6,21,22. Maskininlärning används ofta vid data mining, och både data mining och maskininlärning använder samma nyckelalgoritmer för att upptäcka mönster i data. Åldersuppskattning med hjälp av tandutveckling är baserad på examinatorens bedömning av mognaden för måltänderna, och denna bedömning uttrycks som ett steg för varje måltand. DM kan användas för att analysera sambandet mellan tandbedömningssteg och faktisk ålder och har potential att ersätta traditionell statistisk analys. Därför, om vi tillämpar DM -tekniker på åldersuppskattning, kan vi implementera maskininlärning i kriminalteknisk åldersberäkning utan att oroa sig för juridiskt ansvar. Flera jämförande studier har publicerats på möjliga alternativ till traditionella manuella metoder som används i kriminalteknisk praxis och EBM-baserade metoder för att bestämma tandålder. Shen et al23 visade att DM -modellen är mer exakt än den traditionella kamerarformeln. Galibourg et al24 använde olika DM -metoder för att förutsäga ålder enligt Demirdjian -kriteriet25 och resultaten visade att DM -metoden överträffade Demirdjian- och Willems -metoderna för att uppskatta den franska befolkningens ålder.
För att uppskatta tandåldern för koreanska ungdomar och unga vuxna används Lees metod 4 i stor utsträckning i koreansk kriminalteknisk praxis. Denna metod använder traditionell statistisk analys (såsom multipel regression) för att undersöka förhållandet mellan koreanska ämnen och kronologisk ålder. I denna studie definieras åldersuppskattningsmetoder erhållna med traditionella statistiska metoder som "traditionella metoder." Lees metod är en traditionell metod, och dess noggrannhet har bekräftats av Oh et al. 5; Emellertid är tillämpningen av åldersuppskattning baserad på DM -modellen i koreansk kriminalteknisk praxis fortfarande tveksam. Vårt mål var att vetenskapligt validera den potentiella användbarheten av åldersuppskattning baserat på DM -modellen. Syftet med denna studie var (1) att jämföra noggrannheten för två DM -modeller vid uppskattning av tandålder och (2) att jämföra klassificeringsprestanda för 7 DM -modeller vid 18 års ålder med de som erhölls med traditionella statistiska metoder förfall på andra och tredje molar i båda käkarna.
Medel och standardavvikelser från kronologisk ålder efter stadium och tandtyp visas online i kompletterande tabell S1 (träningsuppsättning), kompletterande tabell S2 (internt testuppsättning) och kompletterande tabell S3 (extern testuppsättning). Kappa-värdena för intra- och interobserver-tillförlitlighet som erhölls från träningsuppsättningen var 0,951 respektive 0,947. P -värden och 95% konfidensintervall för kappavärden visas i online -tilläggstabell S4. Kappa -värdet tolkades som ”nästan perfekt”, i överensstämmelse med kriterierna för Landis och Koch26.
Vid jämförelse av genomsnittligt absolut fel (MAE) överträffar den traditionella metoden något DM -modellen något för alla kön och i den externa manliga testuppsättningen, med undantag av flerskiktsperceptron (MLP). Skillnaden mellan den traditionella modellen och DM -modellen på den interna MAE -testuppsättningen var 0,12–0,19 år för män och 0,17–0,21 år för kvinnor. För det externa testbatteriet är skillnaderna mindre (0,001–0,05 år för män och 0,05–0,09 år för kvinnor). Dessutom är root -medelkvadratfelet (RMSE) något lägre än den traditionella metoden, med mindre skillnader (0,17–0,24, 0,2–0,24 för den manliga interna testuppsättningen och 0,03–0,07, 0,04–0,08 för extern testuppsättning). ). MLP visar något bättre prestanda än enstaka lager Perceptron (SLP), utom i fallet med den kvinnliga externa testuppsättningen. För MAE och RMSE poängterar den externa testuppsättningen högre än den interna testuppsättningen för alla kön och modeller. Alla MAE och RMSE visas i tabell 1 och figur 1.
MAE och RMSE av traditionella modeller och data mining regressionsmodeller. Genomsnittligt absolut fel MAE, Root Mean Square Error RMSE, Single Layer Perceptron SLP, Multilayer Perceptron MLP, Traditional CM Method.
Klassificeringsprestanda (med en avgränsning på 18 år) av de traditionella och DM -modellerna demonstrerades i termer av känslighet, specificitet, positivt prediktivt värde (PPV), negativt prediktivt värde (NPV) och område under mottagarens driftskarakteristiska kurva (AUROC) 27 (tabell 2, figur 2 och kompletterande figur 1 online). När det gäller känsligheten hos det interna testbatteriet utförde traditionella metoder bäst bland män och värre bland kvinnor. Skillnaden i klassificeringsprestanda mellan traditionella metoder och SD är emellertid 9,7% för män (MLP) och endast 2,4% för kvinnor (XGBOOST). Bland DM -modeller visade logistisk regression (LR) bättre känslighet hos båda könen. När det gäller specificiteten för den interna testuppsättningen observerades att de fyra SD -modellerna presterade bra hos män, medan den traditionella modellen presterade bättre hos kvinnor. Skillnaderna i klassificeringsprestanda för män och kvinnor är 13,3% (MLP) respektive 13,1% (MLP), vilket indikerar att skillnaden i klassificeringsprestanda mellan modellerna överskrider känsligheten. Bland DM -modellerna utförde Support Vector Machine (SVM), beslutsträd (DT) och slumpmässiga skogsmodeller (RF) bäst bland män, medan LR -modellen presterade bäst bland kvinnor. AUROC för den traditionella modellen och alla SD-modeller var större än 0,925 (K-nearest granne (KNN) hos män), vilket visade utmärkt klassificeringsprestanda vid diskriminering av 18-åriga prover28. För den externa testuppsättningen var det en minskning av klassificeringsprestanda när det gäller känslighet, specificitet och AUROC jämfört med den interna testuppsättningen. Dessutom varierade skillnaden i känslighet och specificitet mellan klassificeringsprestanda för de bästa och värsta modellerna från 10% till 25% och var större än skillnaden i den interna testuppsättningen.
Känslighet och specificitet för klassificeringsmodeller för data mining jämfört med traditionella metoder med en avgränsning på 18 år. KNN K närmaste granne, SVM Support Vector Machine, LR Logistic Regression, DT Decision Tree, RF Random Forest, XGB XGBOOST, MLP Multilayer Perceptron, Traditional CM Method.
Det första steget i denna studie var att jämföra noggrannheten i uppskattningar av tandålder som erhölls från sju DM -modeller med de som erhölls med traditionell regression. MAE och RMSE utvärderades i interna testuppsättningar för båda könen, och skillnaden mellan den traditionella metoden och DM -modellen varierade från 44 till 77 dagar för MAE och från 62 till 88 dagar för RMSE. Även om den traditionella metoden var något mer exakt i denna studie, är det svårt att dra slutsatsen om en så liten skillnad har klinisk eller praktisk betydelse. Dessa resultat indikerar att noggrannheten i uppskattning av tandålder med användning av DM -modellen är nästan densamma som för den traditionella metoden. Direkt jämförelse med resultat från tidigare studier är svår eftersom ingen studie har jämfört noggrannheten hos DM -modeller med traditionella statistiska metoder med samma teknik för att spela in tänder i samma åldersintervall som i denna studie. Galibourg et al24 jämförde MAE och RMSE mellan två traditionella metoder (Demirjian Method25 och Willems Method29) och 10 DM -modeller i en fransk befolkning i åldern 2 till 24 år. De rapporterade att alla DM -modeller var mer exakta än traditionella metoder, med skillnader på 0,20 respektive 0,38 år i MAE respektive 0,25 och 0,47 år i RMSE jämfört med Willems respektive Demirdjian -metoderna. Avvikelsen mellan SD -modellen och traditionella metoder som visas i Halibourg -studien tar hänsyn till många rapporter30,31,32,33 att Demirdjian -metoden inte exakt uppskattar tandålder i andra populationer än de franska kanadensarna som studien baserades på. I denna studie. Tai et al 34 använde MLP -algoritmen för att förutsäga tandålder från 1636 kinesiska ortodontiska fotografier och jämförde dess noggrannhet med resultaten från Demirjian- och Willems -metoden. De rapporterade att MLP har högre noggrannhet än traditionella metoder. Skillnaden mellan Demirdjian -metoden och den traditionella metoden är <0,32 år, och Willems -metoden är 0,28 år, vilket liknar resultaten från den aktuella studien. Resultaten från dessa tidigare studier24,34 överensstämmer också med resultaten från den aktuella studien och åldersuppskattningsnoggrannheten för DM -modellen och den traditionella metoden är liknande. Baserat på de presenterade resultaten kan vi emellertid bara försiktigt dra slutsatsen att användningen av DM -modeller för att uppskatta ålder kan ersätta befintliga metoder på grund av bristen på jämförande och referens tidigare studier. Uppföljningsstudier som använder större prover behövs för att bekräfta de resultat som erhållits i denna studie.
Bland studierna som testade SD: s noggrannhet vid uppskattning av tandålder, visade vissa högre noggrannhet än vår studie. Stepanovsky et al 35 använde 22 SD -modeller på panoramiska röntgenbilder av 976 tjeckiska invånare i åldrarna 2,7 till 20,5 år och testade noggrannheten för varje modell. De bedömde utvecklingen av totalt 16 övre och nedre vänstra permanenta tänder med hjälp av de klassificeringskriterier som föreslagits av Moorrees et al 36. MAE sträcker sig från 0,64 till 0,94 år och RMSE sträcker sig från 0,85 till 1,27 år, vilket är mer exakta än de två DM -modellerna som användes i denna studie. Shen et al23 använde Cameriere -metoden för att uppskatta tandåldern för sju permanenta tänder i den vänstra mandible i östra kinesiska invånare i åldrarna 5 till 13 år och jämförde den med åldrar uppskattade med hjälp av linjär regression, SVM och RF. De visade att alla tre DM -modellerna har högre noggrannhet jämfört med den traditionella kameranformeln. MAE och RMSE i Shens studie var lägre än i DM -modellen i denna studie. Den ökade precisionen i studierna av Stepanovsky et al. 35 och Shen et al. 23 kan bero på införandet av yngre ämnen i sina studieprover. Eftersom åldersuppskattningar för deltagare med utveckling av tänder blir mer exakta när antalet tänder ökar under tandutvecklingen, kan noggrannheten för den resulterande åldersberäkningsmetoden komprometteras när studiedeltagarna är yngre. Dessutom är MLP: s fel i åldersuppskattning något mindre än SLP: er, vilket innebär att MLP är mer exakt än SLP. MLP anses vara något bättre för åldersuppskattning, möjligen på grund av de dolda skikten i MLP38. Det finns emellertid ett undantag för det yttre urvalet av kvinnor (SLP 1.45, MLP 1.49). Upptäckten att MLP är mer exakt än SLP vid bedömningen av ålder kräver ytterligare retrospektiva studier.
Klassificeringsprestanda för DM-modellen och den traditionella metoden vid en 18-årig tröskel jämfördes också. Alla testade SD-modeller och traditionella metoder på den interna testuppsättningen visade praktiskt acceptabla nivåer av diskriminering för det 18-åriga provet. Känsligheten för män och kvinnor var större än 87,7% respektive 94,9% och specificiteten var större än 89,3% och 84,7%. AUROC för alla testade modeller överstiger också 0,925. Så vitt vi vet har ingen studie testat prestanda för DM-modellen för 18-årig klassificering baserad på tandmognad. Vi kan jämföra resultaten från denna studie med klassificeringsprestanda för djupa inlärningsmodeller på panoramiska röntgenbilder. Guo et al.15 beräknade klassificeringsprestanda för en CNN-baserad djupinlärningsmodell och en manuell metod baserad på Demirjians metod för en viss ålderströskel. Känsligheten och specificiteten för den manuella metoden var 87,7% respektive 95,5%, och känsligheten och specificiteten för CNN -modellen överskred 89,2% respektive 86,6%. De drog slutsatsen att djupa inlärningsmodeller kan ersätta eller överträffa manuell bedömning vid klassificering av ålderströsklar. Resultaten av denna studie visade liknande klassificeringsprestanda; Det tros att klassificering med DM -modeller kan ersätta traditionella statistiska metoder för åldersuppskattning. Bland modellerna var DM LR den bästa modellen när det gäller känslighet för det manliga provet och känsligheten och specificiteten för det kvinnliga provet. LR rankas som nummer två i specificiteten för män. Dessutom anses LR vara en av de mer användarvänliga DM35-modellerna och är mindre komplexa och svåra att bearbeta. Baserat på dessa resultat ansågs LR vara den bästa avgränsningsklassificeringsmodellen för 18-åringar i den koreanska befolkningen.
Sammantaget var noggrannheten i åldersuppskattning eller klassificeringsprestanda på den externa testuppsättningen dålig eller lägre jämfört med resultaten på den interna testuppsättningen. Vissa rapporter indikerar att klassificeringsnoggrannheten eller effektiviteten minskar när åldersberäkningar baserat på den koreanska befolkningen tillämpas på den japanska befolkningen5,39, och ett liknande mönster hittades i den aktuella studien. Denna försämringstrend observerades också i DM -modellen. För att exakt uppskatta ålder, även när man använder DM i analysprocessen, bör metoder härrörande från infödda populationsdata, såsom traditionella metoder, föredras 5,39,40,41,42. Eftersom det är oklart om djupa inlärningsmodeller kan visa liknande trender, behövs studier som jämför klassificeringsnoggrannhet och effektivitet med traditionella metoder, DM -modeller och djupa inlärningsmodeller på samma prover för att bekräfta om konstgjord intelligens kan övervinna dessa rasskillnader i begränsad ålder. bedömningar.
Vi visar att traditionella metoder kan ersättas av åldersuppskattning baserat på DM -modellen i kriminalteknisk åldersuppskattning i Korea. Vi upptäckte också möjligheten att implementera maskininlärning för kriminalteknisk åldersbedömning. Det finns emellertid tydliga begränsningar, till exempel det otillräckliga antalet deltagare i denna studie för att definitivt bestämma resultaten och bristen på tidigare studier för att jämföra och bekräfta resultaten från denna studie. I framtiden bör DM -studier genomföras med större antal prover och mer olika populationer för att förbättra dess praktiska användbarhet jämfört med traditionella metoder. För att validera genomförbarheten av att använda artificiell intelligens för att uppskatta ålder i flera populationer behövs framtida studier för att jämföra klassificeringsnoggrannheten och effektiviteten hos DM och djupa inlärningsmodeller med traditionella metoder i samma prover.
Studien använde 2 657 ortografiska fotografier som samlats in från koreanska och japanska vuxna i åldern 15 till 23 år. De koreanska röntgenbilderna delades upp i 900 träningsuppsättningar (19,42 ± 2,65 år) och 900 interna testuppsättningar (19,52 ± 2,59 år). Träningsuppsättningen samlades in på en institution (Seoul St. Mary's Hospital), och den egna testuppsättningen samlades in vid två institutioner (Seoul National University Dental Hospital och Yonsei University Dental Hospital). Vi samlade också 857 röntgenbilder från en annan befolkningsbaserad data (IWate Medical University, Japan) för extern testning. Röntgenbilder av japanska försökspersoner (19,31 ± 2,60 år) valdes som den externa testuppsättningen. Data samlades retrospektivt för att analysera stadierna för tandutveckling på panoramiska röntgenbilder som tagits under tandbehandling. All information som samlats in var anonyma förutom kön, födelsedatum och röntgrafiddatum. Inkludering och uteslutningskriterier var desamma som tidigare publicerade studier 4, 5. Provets faktiska ålder beräknades genom att subtrahera födelsedatumet från det datum som röntgenbilden togs. Provgruppen delades upp i nio åldersgrupper. Ålders- och könsfördelningar visas i tabell 3 Denna studie genomfördes i enlighet med Helsingforsdeklarationen och godkändes av Institutional Review Board (IRB) vid Seoul St. Mary's Hospital vid det katolska universitetet i Korea (KC22WISI0328). På grund av den retrospektiva utformningen av denna studie kunde informerat samtycke inte erhållas från alla patienter som genomgick radiografisk undersökning för terapeutiska ändamål. Seoul Korea University St. Mary's Hospital (IRB) avstod från kravet på informerat samtycke.
Utvecklingsstadier av bimaxillär andra och tredje molar bedömdes enligt Demircan -kriterier25. Endast en tand valdes om samma typ av tand hittades på vänster och höger sida av varje käke. Om homologa tänder på båda sidor var i olika utvecklingsstadier valdes tanden med det lägre utvecklingsstadiet för att redogöra för osäkerhet i uppskattad ålder. Hundra slumpmässigt utvalda röntgenbilder från träningsuppsättningen fick två erfarna observatörer för att testa interobserver -tillförlitlighet efter prekalibrering för att bestämma tandmognadsstadiet. IntraobServer-tillförlitlighet bedömdes två gånger med tre månaders intervall av den primära observatören.
Köns- och utvecklingsstadiet för den andra och tredje molarna i varje käke i träningsuppsättningen uppskattades av en primär observatör utbildad med olika DM -modeller, och den faktiska åldern sattes som målvärdet. SLP- och MLP -modeller, som används i stor utsträckning i maskininlärning, testades mot regressionsalgoritmer. DM -modellen kombinerar linjära funktioner med hjälp av utvecklingsstadierna för de fyra tänderna och kombinerar dessa data för att uppskatta ålder. SLP är det enklaste neurala nätverket och innehåller inte dolda lager. SLP fungerar baserat på tröskelöverföring mellan noder. SLP -modellen i regression liknar matematiskt multipel linjär regression. Till skillnad från SLP -modellen har MLP -modellen flera dolda lager med olinjära aktiveringsfunktioner. Våra experiment använde ett doldt lager med endast 20 dolda noder med olinjära aktiveringsfunktioner. Använd gradienttecknare som optimeringsmetod och MAE och RMSE som förlustfunktion för att träna vår maskininlärningsmodell. Den bäst erhållna regressionsmodellen tillämpades på de inre och externa testuppsättningarna och tändernas ålder uppskattades.
En klassificeringsalgoritm utvecklades som använder mognaden för fyra tänder på träningsuppsättningen för att förutsäga om ett prov är 18 år eller inte. För att bygga modellen härledde vi sju representationsmaskininlärningsalgoritmer6,43: (1) LR, (2) KNN, (3) SVM, (4) DT, (5) RF, (6) XGBOOST och (7) MLP . LR är en av de mest använda klassificeringsalgoritmerna44. Det är en övervakad inlärningsalgoritm som använder regression för att förutsäga sannolikheten för data som tillhör en viss kategori från 0 till 1 och klassificerar uppgifterna som tillhör en mer trolig kategori baserad på denna sannolikhet; Huvudsakligen används för binär klassificering. KNN är en av de enklaste maskininlärningsalgoritmerna45. När den får nya inmatningsdata hittar den K -data nära den befintliga uppsättningen och klassificerar dem sedan i klassen med den högsta frekvensen. Vi ställer in 3 för antalet grannar som betraktas (K). SVM är en algoritm som maximerar avståndet mellan två klasser genom att använda en kärnfunktion för att utöka det linjära utrymmet till ett icke-linjärt utrymme som kallas Fields46. För denna modell använder vi förspänning = 1, kraft = 1 och gammad = 1 som hyperparametrar för polynomkärnan. DT har tillämpats inom olika områden som en algoritm för att dela upp en hel datauppsättning i flera undergrupper genom att representera beslutsregler i en trädstruktur47. Modellen är konfigurerad med ett lägsta antal poster per nod på 2 och använder Gini -indexet som ett mått på kvalitet. RF är en ensemble -metod som kombinerar flera DT: er för att förbättra prestanda med hjälp av en bootstrap -aggregeringsmetod som genererar en svag klassificerare för varje prov genom att slumpmässigt rita prover av samma storlek flera gånger från den ursprungliga dataset48. Vi använde 100 träd, 10 träddjup, 1 minsta nodstorlek och Gini -blandningsindex som nodseparationskriterier. Klassificeringen av nya uppgifter bestäms med en majoritetsröstning. XGBOOST är en algoritm som kombinerar förstärkningstekniker med en metod som tar som träningsdata felet mellan de faktiska och förutsagda värdena för den tidigare modellen och förstärker felet med gradienter49. Det är en allmänt använt algoritm på grund av dess goda prestanda och resurseffektivitet, samt hög tillförlitlighet som en övermonteringsfunktion. Modellen är utrustad med 400 stödhjul. MLP är ett neuralt nätverk där en eller flera perceptroner bildar flera lager med ett eller flera dolda skikt mellan ingångs- och utgångsskikten38. Med detta kan du utföra icke-linjär klassificering där när du lägger till ett ingångslager och får ett resultatvärde jämförs det förutsagda resultatvärdet med det faktiska resultatvärdet och felet sprids tillbaka. Vi skapade ett doldt lager med 20 dolda neuroner i varje lager. Varje modell vi utvecklade användes på interna och externa uppsättningar för att testa klassificeringsprestanda genom att beräkna känslighet, specificitet, PPV, NPV och AUROC. Känslighet definieras som förhållandet mellan ett prov som uppskattas vara 18 år eller äldre till ett prov som uppskattas till 18 år eller äldre. Specificitet är andelen prover under 18 år och de som uppskattas vara under 18 år.
Dentalstegen bedömdes i träningsuppsättningen omvandlades till numeriska steg för statistisk analys. Multivariat linjär och logistisk regression utfördes för att utveckla prediktiva modeller för varje kön och härleda regressionsformler som kan användas för att uppskatta ålder. Vi använde dessa formler för att uppskatta tandåldern för både interna och externa testuppsättningar. Tabell 4 visar regressions- och klassificeringsmodeller som användes i denna studie.
Intra- och interobserver-tillförlitlighet beräknades med Cohens Kappa-statistik. För att testa noggrannheten hos DM och traditionella regressionsmodeller beräknade vi MAE och RMSE med hjälp av de uppskattade och faktiska åldrarna för de interna och externa testuppsättningarna. Dessa fel används ofta för att utvärdera noggrannheten i modellprognoser. Ju mindre fel, desto högre är prognosens noggrannhet. Jämför MAE och RMSE för interna och externa testuppsättningar beräknade med DM och traditionell regression. Klassificeringsprestanda för den 18-åriga avgränsningen i traditionell statistik bedömdes med hjälp av en 2 × 2 beredskapstabell. Den beräknade känsligheten, specificiteten, PPV, NPV och AUROC för testuppsättningen jämfördes med de uppmätta värdena för DM -klassificeringsmodellen. Data uttrycks som medelvärde ± standardavvikelse eller antal (%) beroende på datakarakteristika. Tvåsidiga p-värden <0,05 ansågs statistiskt signifikanta. Alla rutinmässiga statistiska analyser utfördes med SAS version 9.4 (SAS Institute, Cary, NC). DM -regressionsmodellen implementerades i Python med användning av KERAS50 2.2.4 Backend och TensorFlow51 1.8.0 specifikt för matematiska operationer. DM -klassificeringsmodellen implementerades i Waikato kunskapsanalysmiljö och Konstanz Information Miner (KNIME) 4.6.152 Analysplattform.
Författarna erkänner att data som stöder studiens slutsatser finns i artikeln och kompletterande material. Datasätten som genererats och/eller analyserades under studien är tillgängliga från motsvarande författare på rimlig begäran.
Ritz-Timme, S. et al. Åldersbedömning: State of the Art för att uppfylla de specifika kraven i kriminalteknisk praxis. Internationalitet. J. Juridisk medicin. 113, 129–136 (2000).
Schmeling, A., Reisinger, W., Geserik, G. och Olze, A. Aktuell status för kriminalteknisk bedömning av levande ämnen för straffrättsliga åtal. Kriminaltekniker. medicin. Patologi. 1, 239–246 (2005).
Pan, J. et al. En modifierad metod för att bedöma tandåldern för barn i åldern 5 till 16 år i östra Kina. klinisk. Muntlig undersökning. 25, 3463–3474 (2021).
Lee, SS etc. Kronologi för utvecklingen av andra och tredje molar i koreanerna och dess tillämpning för kriminalteknisk åldersbedömning. Internationalitet. J. Juridisk medicin. 124, 659–665 (2010).
Åh, S., Kumagai, A., Kim, Sy och Lee, SS noggrannhet för åldersuppskattning och uppskattning av den 18-åriga tröskeln baserad på mognaden för andra och tredje molar i koreanerna och japanska. PLoS One 17, E0271247 (2022).
Kim, JY, et al. Preoperativ maskininlärningsbaserad dataanalys kan förutsäga resultat av sömnkirurgi hos patienter med OSA. vetenskapen. Rapport 11, 14911 (2021).
Han, M. et al. Exakt åldersuppskattning från maskininlärning med eller utan mänsklig ingripande? Internationalitet. J. Juridisk medicin. 136, 821–831 (2022).
Khan, S. och Shaheen, M. Från data mining till data mining. J.Information. vetenskapen. https://doi.org/10.1177/01655515211030872 (2021).
Khan, S. och Shaheen, M. Wisrule: Den första kognitiva algoritmen för associeringsregelbrytning. J.Information. vetenskapen. https://doi.org/10.1177/01655515221108695 (2022).
Shaheen M. och Abdullah U. Karm: Traditionell data mining baserad på sammanhangsbaserade associeringsregler. kalkylera. Matt. fortsätta. 68, 3305–3322 (2021).
Muhammad M., Rehman Z., Shaheen M., Khan M. och Habib M. Djup inlärningsbaserad semantisk likhetsdetektering med textdata. informera. Teknologier. kontrollera. https://doi.org/10.5755/j01.itc.49.4.27118 (2020).
Tabish, M., Tanoli, Z. och Shahin, M. Ett system för att erkänna aktivitet i sportvideor. multimedia. Verktygsapplikationer https://doi.org/10.1007/s11042-021-10519-6 (2021).
Halabi, SS et al. RSNA Machine Learning Challenge i pediatrisk benålder. Radiologi 290, 498–503 (2019).
Li, Y. et al. Kriminalteknisk åldersuppskattning från röntgenstrålar med bäcken med djup inlärning. EURO. strålning. 29, 2322–2329 (2019).
Guo, YC, et al. Exakt åldersklassificering med manuella metoder och djupa konvolutionella neurala nätverk från ortografiska projektionsbilder. Internationalitet. J. Juridisk medicin. 135, 1589–1597 (2021).
Alabama Dalora et al. Uppskattning av benålder med olika maskininlärningsmetoder: En systematisk litteraturöversikt och metaanalys. PLoS One 14, E0220242 (2019).
Du, H., Li, G., Cheng, K. och Yang, J. Befolkningsspecifik åldersuppskattning av afroamerikaner och kineser baserat på massa kammarvolymer av första molar med hjälp av konstråleberäknad tomografi. Internationalitet. J. Juridisk medicin. 136, 811–819 (2022).
Kim S., Lee YH, Noh YK, Park FK och OH KS som bestämmer åldersgrupper av levande människor som använder konstgjord intelligensbaserade bilder av första molar. vetenskapen. Rapport 11, 1073 (2021).
Stern, D., Payer, C., Giuliani, N. och Urschler, M. Automatisk åldersuppskattning och majoritetsåldersklassificering från multivariat MR -data. IEEE J. Biomed. Hälsovarningar. 23, 1392–1403 (2019).
Cheng, Q., Ge, Z., Du, H. och Li, G. Åldersberäkning baserad på 3D -massa -kammarsegmentering av första molar från konstråleberäknad tomografi genom att integrera djup inlärning och nivåuppsättningar. Internationalitet. J. Juridisk medicin. 135, 365–373 (2021).
Wu, WT, et al. Databrytning i kliniska big data: Vanliga databaser, steg och metodmodeller. Värld. medicin. resurs. 8, 44 (2021).
Yang, J. et al. Introduktion till medicinska databaser och datateknik i data i Big Data -eran. J. AVID. Grundmedicin. 13, 57–69 (2020).
Shen, S. et al. Camerers metod för att uppskatta tandålder med hjälp av maskininlärning. BMC Oral Health 21, 641 (2021).
Galliburg A. et al. Jämförelse av olika maskininlärningsmetoder för att förutsäga tandålder med hjälp av Demirdjian -iscensättningsmetoden. Internationalitet. J. Juridisk medicin. 135, 665–675 (2021).
Demirdjian, A., Goldstein, H. och Tanner, JM Ett nytt system för bedömning av tandålder. fnysa. biologi. 45, 211–227 (1973).
Landis, JR och Koch, GG -mäter av observatörsavtal om kategoriska data. Biometrics 33, 159–174 (1977).
Bhattacharjee S, Prakash D, Kim C, Kim HK och Choi HK. Textural, morfologisk och statistisk analys av tvådimensionell magnetisk resonansavbildning med användning av konstgjord intelligensstekniker för differentiering av primära hjärntumörer. Hälsoinformation. resurs. https://doi.org/10.4258/hir.2022.28.1.46 (2022).
Posttid: Jan-04-2024