Computere hjælper med at vælge den bedste algoritme

  • Oct 24, 2023

Ingeniører ved Ohio State University har udviklet en ny måde at forbedre mønstergenkendelsessoftware på. Deres hurtige test "bedømmer, hvor godt en bestemt mønstergenkendelsesalgoritme vil fungere for en given applikation." Og de tror, ​​at deres metode kan bruges på mange områder, herunder genetik, økonomi, klimamodellering og neurovidenskab.

Ingeniører ved Ohio State University, der bruges til at designe computeralgoritmer til at simulere menneskesyn, har udviklet en ny måde at forbedre mønstergenkendelsessoftware på. Traditionelt bruger denne form for software en metode kaldet lineær funktionsekstraktion, som ikke altid virker og kan føre til ugers spildtid for forskerne. Så forskerne har udviklet en hurtig test "som vurderer, hvor godt en bestemt mønstergenkendelsesalgoritme vil fungere for en given anvendelse." Og de tror, ​​at deres metode kan bruges på mange områder, herunder genetik, økonomi, klimamodellering og neurovidenskab.

Hvorfor startede de denne nye tilgang? Bare fordi de var frustrerede. Her er en forklaring givet af

Aleix Martinez, assisterende professor i el- og computerteknik ved Ohio State, og skaberen af Computational Biology and Cognitive Science Lab.

Størstedelen af ​​mønstergenkendelsesalgoritmer i videnskab og teknik i dag er afledt af samme grundlæggende ligning og anvender de samme metoder, samlet kaldet lineær trækekstraktion, Martinez sagde.
Men de typiske metoder giver ikke altid forskerne de svar, de ønsker. Derfor har Martinez udviklet en hurtig og nem test for på forhånd at finde ud af, hvilke algoritmer der er bedst i en bestemt situation.
"Du kan bruge timer eller uger på at udforske en bestemt metode, bare for at finde ud af, at den ikke virker," sagde han. "Eller du kan bruge vores test og finde ud af med det samme, om du ikke skal spilde din tid med en bestemt tilgang."

Og her er nogle korte citater om deres resultater.

Martinez og [doktorand Manil Zhu] testede maskinsynsalgoritmer ved hjælp af to databaser, en med objekter som æbler og pærer og en anden database med ansigter med forskellige udtryk. De to opgaver - at sortere objekter og identificere udtryk - er tilstrækkeligt forskellige til, at en algoritme potentielt kan være god til at udføre det ene, men ikke til det andet.
Testen vurderer algoritmer på en skala fra nul til én. Jo tættere scoren er på nul, jo bedre er algoritmen. Testen virkede: En algoritme, der fik en score på 0,2 for at sortere ansigter, var rigtig 98 procent af tiden. Den samme algoritme scorede 0,34 for at sortere objekter og havde kun ret 70 procent af tiden, da den udførte opgaven. En anden algoritme scorede 0,68 og sorterede objekter korrekt kun 33 procent af tiden. "Så en score som 0,68 betyder 'spild ikke din tid'," sagde Martinez. "Du behøver ikke at gøre dig umage for at køre den og finde ud af, at den er forkert to tredjedele af tiden."

Dette forskningsarbejde er udgivet af IEEE-transaktioner på mønsteranalyse og maskinintelligens under navnet "Hvor er lineære trækekstraktionsmetoder anvendelige?" (Bind 27, udgave 12, s. 1934-1944, december 2005). Her er et link til det abstrakte og begyndelsen af ​​det.

Et grundlæggende problem i computersyn og mønstergenkendelse er at bestemme, hvor og, vigtigst af alt, hvorfor en given teknik er anvendelig. Dette er ikke kun nødvendigt, fordi det hjælper os med at beslutte, hvilke teknikker der skal anvendes på hvert givet tidspunkt. At vide, hvorfor nuværende algoritmer ikke kan anvendes, letter designet af nye algoritmer, der er robuste over for sådanne problemer. I dette papir rapporterer vi om en teoretisk undersøgelse, der viser, hvor og hvorfor generaliserede egenbaserede lineære ligninger ikke virker.

Og her er et link til hele papiret (PDF-format, 20 sider, 396 KB). Her er nogle uddrag fra konklusionen.

I dette papir har vi vist, at lineære funktionsekstraktionsalgoritmer ikke altid er garanteret at minimere Bayes-fejlen, selvom de anvendte metrikker i princippet gør det. Vi har vist, at fornuftskontrollen ikke er, om dataene er homoskedastiske eller heteroskedastiske (hvilket havde været vores almindelige praksis).
Vi har derefter brugt vores resultater til at definere en ny robust algoritme (af sådanne lineære metoder). Og vi har diskuteret, hvordan disse resultater kan bruges til at forbedre designet af nuværende algoritmer.
Resultaterne rapporteret i denne artikel vil hjælpe videnskabsmænd i computersyn til bedre at forstå deres algoritmer og, vigtigst af alt, forbedre dem. Det er klart, at feature-ekstraktionsteknikker er anvendelige til en lang række problemer i videnskaben, og derfor kan man forvente, at resultatet rapporteret i denne artikel vil også påvirke forskningsområder så forskellige som genetik, økonomi, klimamodellering og neurovidenskab.

Hvis du vil læse dette papir, som ikke giver nogen reference til den test, forskerne byggede, bliver du nødt til at børste dine matematiske færdigheder. Under alle omstændigheder ser dette forskningsprojekt lovende ud.

Kilder: Ohio State University pressemeddelelse, 24. januar 2006; og diverse hjemmesider

Du finder relaterede historier ved at følge nedenstående links.

  • Computere
  • ingeniørarbejde
  • Software
  • Syn og visualisering