DI prieš 5 laboratorijos specialistus: ką atskleidė 4 mėnesiai ir daugiau nei 600 kviečių tyrimų

Key Takeaways

DI sistema pasiekė 93,5 % sutapimą su penkiais nepriklausomais grūdų laboratorijos specialistais – tai patenka į natūralią ekspertų nuomonių sklaidą.
Ankstyvųjų klaidų (patamsėję grūdai, kvietrugiai, smulkūs grūdeliai) skaičius smarkiai sumažėjo, kai modelis buvo perapmokytas naudojant sunkiausius ribinius atvejus.
Bandomajame projekte naudoti realūs priėmimo mėginiai per keturis mėnesius, ne laboratorijos demonstracija – rezultatai atspindi kasdienes vertinimo sąlygas.
DI nepakeitė laboratorijos darbuotojų; pasikeitė tai, kam jie skiria laiką – rutininis vertinimas automatizuotas, ribiniai atvejai perduodami ekspertų peržiūrai.

Po 4 mėnesių ir daugiau nei 600 atliktų tyrimų liko vienas lemiamas klausimas: ar DI ir penki profesionalūs grūdų laboratorijos specialistai vienodai įvertins tuos pačius kviečių mėginius?

Dėl tokio galutinio patikrinimo susitarėme bandomojo projekto pradžioje. Jokių kompromisų. Jokių nuolaidų ar vidurkių skaičiavimo idealiomis sąlygomis. Penki nepriklausomi ekspertai, viena DI sistema, vienas bandymas – jo rezultatas ir nulems, ar GrainODM bus pradėtas naudoti gamyboje.

Ši atvejo studija aprašo, kaip mums sekėsi.

Kodėl grūdų kokybės vertinimas yra sudėtingesnis, nei atrodo

Kviečiai nėra tiesiog kviečiai. Kai grūdų partija atvyksta į elevatorių, kvalifikuotas specialistas ją įvertina pagal dešimtis kokybės parametrų: baltymų ir drėgmės rodiklius – prietaisais, o ilgas fizinių priemaišų sąrašas vis dar vertinamas žmogaus akimi.

Šiame bandomajame projekte stebėjome 18 skirtingų priemaišų kategorijų, tarp jų:

fuzarioze pažeisti grūdai
miežiai, avižos, rugiai ir kvietrugiai
skelti ir patamsėję grūdai
kenkėjų pažeisti, susiraukšlėję ir sudygę grūdai
nuolaužos, pašalinės sėklos, kibusis lipikas, lukštai ir bendros grūdinės/šiukšlinės priemaišos

Net kelių procento dalių nuokrypis bet kurioje kategorijoje gali perkelti partiją iš 1-osios klasės į 4-ąją, o tai turi tiesioginių finansinių pasekmių. Daugiau apie tai, kaip reguliatoriai traktuoja šias normas, skaitykite mūsų grūdų priemaišų standartų vadove.

Kaip tradicinėse laboratorijose aptinkami pavieniai defektai, pvz. sudygę grūdai – apie tai skaitykite atvejo studijoje kviečių sudygimo aptikimas.

Be to, šis procesas yra subjektyvus. Du patyrę specialistai, vertindami tą pačią patamsėjusių grūdų partiją, ne visada nustatys vienodą priemaišų procentą. Tai nėra kompetencijos stoka – tokia yra vizualinio klasifikavimo prigimtis, dirbant su grūdais realiomis sąlygomis.

Būtent todėl nusprendėme nesiremti vieno laboranto vertinimu. Penki nepriklausomi ekspertai leido mums nustatyti natūralią žmonių vertinimų sklaidą – ir patikimą atskaitos tašką, su kuriuo galėjome lyginti DI rezultatus.

1 etapas: bandomojo projekto pradžia ir pirmieji iššūkiai

Projektą pradėjome 2025 m. rugpjūtį vienoje didžiausių žemės ūkio bendrovių. GrainODM veikė lygiagrečiai su kliento laboratorija – tos pačios realios, į įmonę atvykstančios grūdų partijos buvo analizuojamos vienu metu. Kiekvieną savaitę komanda kartu peržiūrėdavo rezultatus ir pagal juos atnaujindavo DI modelį.

Per keturis mėnesius iš viso atlikome daugiau nei 600 atskirų tyrimų.

Pirmosios savaitės buvo pamokomiausios. Išryškėjo trys sudėtingiausios kategorijos:

Patamsėjusių grūdų kategorijoje pirmąją savaitę didžiausias neatitikimas siekė 21,43%. Pagrindinė priežastis: kintantis apšvietimas fiksuojant vaizdą ir neišvengiamas subjektyvumas sprendžiant, kas yra „patamsėjęs“ grūdas. Net patys specialistai tai vertina skirtingai, priklausomai nuo konkrečios kviečių veislės.

Kvietrugių atpažinimo paklaida siekė 13,89%. Kvietrugis – rugių ir kviečių hibridas – turi pakankamai morfologinių panašumų su kviečiais, todėl modeliui, neturinčiam pakankamai pavyzdžių, buvo sunku juos nuosekliai atskirti.

Smulkių grūdų neatitikimas pasiekė 9,37%. Problema kilo dėl to, kad modelis „smulkų“ grūdą apibrėžė vizualiai, o laboratorija – pagal sieto akučių dydį.

Tai nebuvo atsitiktinės klaidos. Kiekviena jų turėjo aiškią, nustatomą priežastį, o tai reiškė, kad turėjo ir aiškų sprendimą.

Grįžtamojo ryšio ciklas: nuo duomenų iki tobulesnio veikimo

Šią DI kūrimo dalį lengva nuvertinti. Modelis nebuvo sistema, kurią įdiegėme ir palikome veikti. Kiekvienos savaitės rezultatus analizuodavome, ieškodavome esminių priežasčių ir atnaujindavome mokymo duomenis. Daugiau pavyzdžių. Tikslesnis žymėjimas. Specialios taisyklės nestandartiniams atvejams.

Svarbiausi modelio atnaujinimai projekto metu:

Kada	Atnaujinimas
Pirma savaitė	Iš duomenų rinkinio pašalinti nežymiai patamsėję grūdai; rinkinys papildytas geros kokybės kviečių pavyzdžiais
Antra savaitė	Įdiegta patikimumo slenksčio taisyklė rugių aptikimui – abejotini atvejai atmetami, o ne priskiriami priverstinai
Penkta savaitė	Įdiegtas naujas modelis: patobulintas kvietrugių ir šviesesnių grūdų atpažinimas
Šešta savaitė	Fuzariozės atnaujinimas: pridėta rausvos ir baltos spalvos fuzariozės pažeistų grūdų pavyzdžių; patikslintas žymėjimas esant aiškiems ligos simptomams
Septinta savaitė	Smulkūs grūdai: iš susiraukšlėjusių grūdų kategorijos pašalinti didesni nei 2 mm grūdai, kad atitiktų laboratorijos standartą, pagrįstą sietu

Veiksmų seka buvo apgalvota: nustatome, kur modelio vertinimas skiriasi nuo ekspertų, aiškinamės kodėl, papildome duomenų bazę atitinkamais pavyzdžiais, iš naujo apmokome modelį ir vėl matuojame rezultatus. Būtent taip laikui bėgant DI našumas nuosekliai auga.

Tuo pačiu laikotarpiu savaitinėse peržiūrose išryškėjo ir kitas dalykas. Keliuose mėginiuose GrainODM aptiko priemaišų, kurioms laboratorija buvo priskyrusi nulinę vertę:

Priemaišos tipas	GrainODM aptikimas	Laboratorijos rezultatas
Sudygę grūdai	1,05%	0,00%
Sudygę grūdai	0,95%	0,00%
Pažeisti grūdai	0,90%	0,00%
Miežiai	0,08%	0,00%

DI neklydo. Jis fiksavo priemaišas ties žmogaus suvokimo riba – pavienius grūdus, kuriuos lengva pražiūrėti per ilgą darbo pamainą, ypač partijoje, kuri iš pirmo žvilgsnio atrodo švari. Mašinos, skirtingai nei žmonės, geba išlaikyti vienodą pastabumą kiekvienam grūdui kiekviename mėginyje, net ir po daugelio darbo valandų.

Grįžtamojo ryšio ciklo rezultatai

Vėlyvasis rugsėjis – pagerėjimas jau buvo matuojamas:

Kvietrugiai: neatitikimas sumažėjo nuo 13,89% iki 0,25% – 98% pagerėjimas
Smulkūs grūdai: neatitikimas sumažėjo nuo 9,37% iki 1,70% – 82% pagerėjimas
Patamsėję grūdai: neatitikimas sumažėjo nuo 21,43% iki 6,96% – 68% pagerėjimas

Kiekvienas patobulinimas buvo pasiektas taikant tą patį principą: tikslingesni duomenys, geresnis žymėjimas ir aiškesnis klasifikavimo ribų apibrėžimas. Modelis netapo protingesnis bendrąja prasme – jis tapo tikslesnis vertindamas konkrečius sudėtingus atvejus, nes buvo apmokytas naudojant daugiau tokių pavyzdžių.

Štai kaip DI tobulinimas atrodo praktikoje.

2 etapas: galutinis testas

2026 m. sausio 21 d., po keturių mėnesių lygiagretaus testavimo, surengėme oficialų patikrinimą.

Penki profesionalūs grūdų specialistai nepriklausomai vienas nuo kito išanalizavo 16 kviečių mėginių. Tuos pačius mėginius analizavo ir GrainODM. Niekas nematė kitų rezultatų, kol bandymas nebuvo baigtas. Kiekviename mėginyje buvo įvertinta 18 priemaišų kategorijų ir nustatyta galutinė kokybės klasė.

Tai buvo lemiamas momentas. Sėkmingas patikrinimas reiškė, kad sistema pradedama naudoti gamyboje. Jei nepavyktų – tektų grįžti prie pradinio etapo.

Rezultatai

Metrika	Rezultatas
DI vertinimas sutapo su bent 1 specialisto vertinimu	96,2%
DI vertinimas sutapo su 3 iš 5 specialistų vertinimu	95%
DI vidutinis sutapimas su visų specialistų vertinimais	93,5%
DI vertinimas sutapo su visų 5 specialistų vertinimais	85%

Dvi priemaišų kategorijos pasiekė 100 % sutapimą tarp DI ir visų specialistų (lukštai ir sudygę grūdai), o kitose – pvz. pašalinės sėklos ir pažeisti grūdai – dar liko erdvės tobulėjimui.

Ką iš tiesų reiškia šie skaičiai

Štai kontekstas, suteikiantis šiems rezultatams svarumo.

Kai penki specialistai nepriklausomai vertino tuos pačius mėginius, jų vertinimų vidutinis tarpusavio sutapimas buvo 95,2%. Nors jie yra ekspertai, jie – žmonės. Subjektyvūs sprendimai dėl subtilių vizualinių skirtumų reiškia, kad jie ne visada pateikia visiškai vienodą įvertinimą.

GrainODM rezultatas – 93,5%.

Šis rodiklis ne tik priartėja prie natūralios ekspertų vertinimų sklaidos, bet ir patenka į jos ribas. DI veikia patyrusio specialisto lygiu. Statistiškai GrainODM įtraukimas į vertinimo procesą yra lygiavertis šešto eksperto prisijungimui prie komandos.

Kad dar aiškiau matytume šių skaičių prasmę, verta pažvelgti į tai, kaip vertino tik žmonės. Kai penki laboratorijos specialistai vertino tas pačias 16 kviečių mėginių, dirbdami vienodomis sąlygomis ir pagal tą pačią klasifikavimo taisyklių knygą, jie 6 iš 16 mėginių nepriėjo prie vienbalsio sprendimo dėl galutinės kokybės klasės. Dviejų mėginių atveju balsai realiai pasiskirstė santykiu 3 prieš 2 – tai reiškia, kad ta pati partija, įvertinta kitos specialistų grupės kitu metu, galėjo gauti kitą klasę.

Kokybės klasės nustatymas yra iš prigimties sprendimo klausimas – net ir tiems ekspertams, kurie dirba pagal tas pačias taisykles.

Čia ir atsiranda nuoseklumo svarba. GrainODM kiekvienam mėginiui kiekvieną kartą taiko tą pačią logiką – be skirtumų tarp pamainų, be besikaupiančio nuovargio, be lėto, nepastebimo subjektyvumo „nuslydimo“ laikui bėgant. Esant identiškiems įvesties duomenims, sistema pateikia identišką rezultatą – to negali užtikrinti joks žmogaus vertintojas, kai kalbame apie tūkstančius mėginių.

Sprendimas: patvirtinta naudoti gamyboje

Bandomasis projektas sėkmingai praėjo galutinį patikrinimą. Validavimo rezultatai parodė, kad DI gali veikti eksperto lygiu realiomis priėmimo sąlygomis.

Vertinamos realios grūdų partijos. Atliekamos realios finansinės klasifikacijos. Sistemos rezultatai tiesiogiai naudojami priimant sprendimus dėl grūdų kokybės klasės – nuo 1-osios iki 4-osios – nuo kurios priklauso kaina, saugojimo sąlygos ir tolesnis panaudojimas. Tai nebe bandymai. Sprendimai turi realias finansines pasekmes.

Ką tai reiškia grūdų kokybės kontrolei

Grūdų kokybės vertinimui visada reikėjo ir reikės kvalifikuotų specialistų. Tai nesikeičia.

Keičiasi darbo krūvio paskirstymas. Sistema, veikianti eksperto lygiu – nuosekliai vertinanti tūkstančius mėginių, niekada nepavargstanti, pastebinti defektus ties žmogaus suvokimo riba – leidžia ekspertams kitaip paskirstyti savo laiką. Rutininis klasifikavimas automatizuojamas, o sudėtingi atvejai, dviprasmiškos partijos, tiekėjų tendencijų analizė – visa tai lieka specialistų kompetencijai.

Klausimas niekada nebuvo, ar DI gali pakeisti grūdų specialistus. Klausimas buvo kitas: ar DI gali veikti pakankamai patikimai, kad taptų jų kolega?

Po 4 mėnesių, daugiau nei 600 tyrimų ir oficialaus patikrinimo, kuriame dalyvavo penki nepriklausomi ekspertai, atsakymas yra taip.

Dažniausiai Užduodami Klausimai

Per 16 kviečių mėginių ir 18 priemaišų kategorijų DI vidutiniškai sutapo su penkiais nepriklausomais laboratorijos specialistais 93,5 %. Žmonių specialistų tarpusavio sutapimas buvo 95,2 %, todėl DI atsidūrė natūralioje ekspertų nuomonių sklaidoje.

Visi mėginiai buvo iš realių įmonę atvežtų kviečių partijų. DI ir laboratorijos komanda vertino tas pačias partijas lygiagrečiai apie keturis mėnesius, padengdami šimtus rutininių priėmimo tyrimų, o ne specialiai parinktą testų rinkinį.

Sunkiausios kategorijos buvo patamsėję grūdai, kvietrugiai ir smulkūs ar susiraukšlėję grūdai, taip pat fuzariozė. Tikslinis perapmokymas reikšmingai sumažino klaidas pirmose trijose kategorijose; fuzariozės klasifikacijos tobulinimas vis dar priklauso nuo daugiau kokybiškai paženklintų duomenų.

Šioje atvejo studijoje skaičiai taikomi kviečiams ir šios įmonės vertinimo standartams. Tačiau patikrinimo procesas – paleisti DI lygiagrečiai, lyginti su keliais ekspertais ir iteruoti sunkiausius atvejus – gali būti kartojamas kitoms kultūroms, įmonėms ir kokybės schemoms.

The New Standard in Grain Purity Analysis

Data, not guesswork. Learn how GrainODM sets a new benchmark for digital grain inspection.

Learn More & Watch Demo →

600x faster inspection

80% reduced labor costs

DI prieš 5 laboratorijos specialistus: ką atskleidė 4 mėnesiai ir daugiau nei 600 kviečių tyrimų

Key Takeaways

Dažniausiai Užduodami Klausimai

Kokiu tikslumu DI sutapo su laboratorijos specialistais?

Kokie mėginiai naudoti bandomajame projekte?

Kur DI kentėjo labiausiai?

Ar šie rezultatai tinka kitiems kultūrams ar įmonėms?

The New Standard in Grain Purity Analysis