| Maşın öyrənməsi və intellektual verilənlərin analizi |
|---|
![]() |
Verilənlərin artırılması — maşın öyrənməsi və süni intellekt sahəsində modelin öyrənmə qabiliyyətini artırmaq və ümumiləşdirmə (ing. generalization) bacarığını yüksəltmək üçün mövcud süni şəkildə yeni nümunələr yaratmaq prosesi. Bu üsul xüsusilə kompüter görünüşü, təbii dilin emalı və kimi sahələrdə geniş istifadə olunur.
Tipik yanaşmalara təsadüfi fırlatma, kəsmə, ölçü dəyişmə, rəng dəyişiklikləri və səs-küy əlavə edilməsi daxildir. Təbii dil emalında isə sinonim əvəzlənməsi, cümlə strukturlarının dəyişdirilməsi və ya generativ modellərlə yeni mətnlər yaradılması istifadə olunur. Verilənlərin artırılması həmçinin dərin öyrənmə modellərinin həddən artıq öyrənməsinin (ing. overfitting) qarşısını almağa, balanssız məlumat dəstlərini tarazlaşdırmağa və modelin performansını real mühitdə yüksəltməyə xidmət edir.
Siqnal emalı üçün verilənlərin artırılması
| ]Zaman sırası (time series) üçün artırma üsulu kimi qalıq və ya blok bootstrap yanaşmalarından istifadə edilə bilər.
Bioloji siqnallar
| ]Süni verilənlərin artırılması, xüsusən yüksək ölçülü və az nümunəli olan bioloji məlumatlar üçün maşın öyrənməsində təsnifatın (ing. classification) keyfiyyətini yüksəltmək baxımından böyük əhəmiyyət daşıyır. Həm əlil, həm də sağlam şəxslərdə robot nəzarəti və siqnal artırılması tətbiqləri hələ də əsasən subyektə xas analizlərə əsaslanır. Parkinson xəstəliyinə aid elektromioqrafiya (EMG) siqnallarının toplanması çətin olduğundan məlumat azlığı xüsusi ilə nəzərə çarpır. Zanini və həmkarları generativ adversarial şəbəkə (xüsusilə DCGAN) istifadə etməklə üslub ötürməsi (ing. style transfer) apararaq Parkinson xəstəliyinə məxsus sintetik EMG siqnallarının yaradılmasının mümkün olduğunu göstərmişdir.
Bu yanaşmalar elektroensefaloqrafiya (EEQ, beyin dalğaları) üçün də mühüm əhəmiyyət kəsb edir. Vanq və digərləri dərin konvolyusion neyron şəbəkələrdən istifadə edərək EEQ-əsaslı emosiyanın tanınması mövzusunu araşdırmış və məlumat artırılması tətbiq edildikdə nəticələrin yaxşılaşdığını göstərmişdir.
Tez-tez istifadə olunan üsullardan biri real məlumatın komponentlərini yenidən tərtib etməklə sintetik siqnallar yaratmaqdır. Lotte “Analogiyaya əsaslanan süni sınaq yaradılması” adlı metod təklif etmişdir. Bu yanaşmada üç nümunə ( ) əsasında what nisbəti qədər çevrilmə tətbiq olunur və nəticədə adlı yeni siqnal formalaşır. Bu üsul Linear Discriminant Analysis klassifikatorunun üç müxtəlif verilənlər toplusu üzərində nəticələrini yaxşılaşdırmışdır.
Son araşdırmalar göstərir ki, nisbətən sadə texnikalar belə böyük təsir göstərə bilir. Məsələn, Frir toplanmış verilənlərə səs-küy əlavə etməklə yeni nümunələr yaratmağın, əvvəlcə zəif nəticə göstərən bir neçə modelin öyrənmə qabiliyyətini yüksəltdiyini qeyd etmişdir. Tsinqanos və digərləri böyüklük deformasiyası (ing. magnitude warping), dalğacıq parçalanması (ing. wavelet decomposition) və sintetik səthi EMG modelləri (generativ yanaşmalar) kimi üsulları əl jestlərinin tanınması üçün araşdırmış və artırılmış məlumatların öyrədilmə mərhələsinə əlavə edilməsi nəticəsində təsnifat göstəricilərinin 16%-dək yaxşılaşdığını bildirmişdir. Daha sonrakı tədqiqatlar generativ modellərin süni məlumat yaratmaq və həmin məlumatı öyrənmə prosesinə daxil etmək imkanlarına yönəlmişdir. 2018-ci ildə Luo və digərləri Şərti Vasserşteyn Generativ Adversarial Şəbəkələrindən (ing. Conditional WGAN) istifadə edərək EEQ siqnal məlumatı yaratmış və klassik train-test çərçivəsində təlim dəstinə əlavə etmiş, nəticədə təsnifat göstəricilərinin yaxşılaşdığını müşahidə etmişdir.
Mexaniki siqnallar
| ]Verilənlərin artırılması əsasında mexaniki siqnalların proqnozlaşdırılması yeni texnoloji innovasiyalar – enerji paylanmasının optimallaşdırılması, 5G rabitə sahəsi və robot nəzarət mühəndisliyi kimi istiqamətlər üçün yeni imkanlar açır. 2022-ci ildə Yang və həmkarları məkan-zaman verilənlərinin korrelyasiyası ilə məlumat artırılması və məlumatın azaldılması (ing. data pruning) yanaşmalarını birləşdirən, məhdudiyyətlər, optimallaşdırma və idarəetməni dərin şəbəkə çərçivəsinə inteqrasiya edən metod təklif etmişdir. Bu yanaşma real sənaye layihələrində dərin öyrənmənin interpretasiyasını, təhlükəsizliyini və idarəolunmasını artırmaq üçün açıq riyazi proqramlaşdırma tənlikləri və analitik həllərdən istifadə edir.
İstinadlar
| ]- Dempster, A.P.; Laird, N.M.; Rubin, D.B. "Maximum Likelihood from Incomplete Data Via the EM Algorithm". Journal of the Royal Statistical Society. Series B (Methodological). 39 (1). 1977: 1–22. doi:10.1111/j.2517-6161.1977.tb01600.x. 10 oktyabr 2022 tarixində arxivləşdirilib. İstifadə tarixi: 28 avqust 2024.
- Rubin, Donald. "Comment: The Calculation of Posterior Distributions by Data Augmentation". Journal of the American Statistical Association. 82 (398). 1987. doi:10.2307/2289460. JSTOR 2289460. 7 avqust 2024 tarixində arxivləşdirilib. İstifadə tarixi: 28 avqust 2024.
- Jackman, Simon. Bayesian Analysis for the Social Sciences. John Wiley & Sons. 2009. 236. ISBN .
- Shorten, Connor; Khoshgoftaar, Taghi M. "A survey on Image Data Augmentation for Deep Learning". Mathematics and Computers in Simulation. springer. 6. 2019. doi:10.1186/s40537-019-0197-0.
- Wang, Shujuan; Dai, Yuntao; Shen, Jihong; Xuan, Jingxue. "Research on expansion and classification of imbalanced data based on SMOTE algorithm". Scientific Reports (ingilis). 11 (1). 15 dekabr 2021: 24039. Bibcode:2021NatSR..1124039W. doi:10.1038/s41598-021-03430-5. ISSN 2045-2322. PMC 8674253 (#bad_pmc). PMID 34912009 (#bad_pmid).
- Yann Lecun; və b. Learning algorithms for classification: A comparison on handwritten digit recognition (Conference paper). nyuscholars.nyu.edu. World Scientific. 1995. 261–276. İstifadə tarixi: 14 may 2023.
- Simard, P.Y.; Steinkraus, D.; Platt, J.C. Best practices for convolutional neural networks applied to visual document analysis // Seventh International Conference on Document Analysis and Recognition, 2003. Proceedings. 1. 2003. 958–963. doi:10.1109/ICDAR.2003.1227801. ISBN .
- Hinton, Geoffrey E.; Srivastava, Nitish; Krizhevsky, Alex; Sutskever, Ilya; Salakhutdinov, Ruslan R. "Improving neural networks by preventing co-adaptation of feature detectors". 2012. arXiv:1207.0580 [cs.NE].
- Cagli, Eleonora; Dumas, Cécile; Prouff, Emmanuel. Convolutional Neural Networks with Data Augmentation Against Jitter-Based Countermeasures: Profiling Attacks Without Pre-processing // Fischer, Wieland; Homma, Naofumi (redaktorlar ). Cryptographic Hardware and Embedded Systems – CHES 2017. Lecture Notes in Computer Science (ingilis). 10529. Cham: Springer International Publishing. 2017. 45–68. doi:10.1007/978-3-319-66787-4_3. ISBN .
- Shorten, Connor; Khoshgoftaar, Taghi M. "A survey on Image Data Augmentation for Deep Learning". Journal of Big Data. 6 (1). 6 iyul 2019: 60. doi:10.1186/s40537-019-0197-0. ISSN 2196-1115.
- Lotte, Fabien. "Signal Processing Approaches to Minimize or Suppress Calibration Time in Oscillatory Activity-Based Brain–Computer Interfaces" (PDF). Proceedings of the IEEE. 103 (6). 2015: 871–890. doi:10.1109/JPROC.2015.2404941. ISSN 0018-9219. 3 aprel 2023 tarixində arxivləşdirilib (PDF). İstifadə tarixi: 5 noyabr 2022.
- Ghorbel, Emna; Ghorbel, Faouzi. "Data augmentation based on shape space exploration for low-size datasets: application to 2D shape classification". Neural Computing and Applications (ingilis). 36 (17). 1 iyun 2024: 10031–10054. doi:10.1007/s00521-024-09798-5. ISSN 1433-3058.
- Anicet Zanini, Rafael; Luna Colombini, Esther. "Parkinson's Disease EMG Data Augmentation and Simulation with DCGANs and Style Transfer". Sensors. 20 (9). 2020: 2605. Bibcode:2020Senso..20.2605A. doi:10.3390/s20092605. ISSN 1424-8220. PMC 7248755 (#bad_pmc). PMID 32375217 (#bad_pmid).
- Wang, Fang; Zhong, Sheng-hua; Peng, Jianfeng; Jiang, Jianmin; Liu, Yan. Data Augmentation for EEG-Based Emotion Recognition with Deep Convolutional Neural Networks // MultiMedia Modeling. Lecture Notes in Computer Science. 10705. 2018. 82–93. doi:10.1007/978-3-319-73600-6_8. ISBN . ISSN 0302-9743.
- Freer, Daniel; Yang, Guang-Zhong. "Data augmentation for self-paced motor imagery classification with C-LSTM". Journal of Neural Engineering. 17 (1). 2020: 016041. Bibcode:2020JNEng..17a6041F. doi:10.1088/1741-2552/ab57c0. hdl:10044/1/75376. ISSN 1741-2552. PMID 31726440.
- Tsinganos, Panagiotis; Cornelis, Bruno; Cornelis, Jan; Jansen, Bart; Skodras, Athanassios. "Data Augmentation of Surface Electromyography for Hand Gesture Recognition". Sensors. 20 (17). 2020: 4892. Bibcode:2020Senso..20.4892T. doi:10.3390/s20174892. ISSN 1424-8220. PMC 7506981 (#bad_pmc). PMID 32872508 (#bad_pmid).
- Yang, Yang. "Wind speed forecasting with correlation network pruning and augmentation: A two-phase deep learning method". Renewable Energy. 198 (1). 2022: 267–282. arXiv:2306.01986. Bibcode:2022REne..198..267Y. doi:10.1016/j.renene.2022.07.125. ISSN 0960-1481.
wikipedia, oxu, kitab, kitabxana, axtar, tap, meqaleler, kitablar, oyrenmek, wiki, bilgi, tarix, tarixi, endir, indir, yukle, izlə, izle, mobil, telefon ucun, azeri, azəri, azerbaycanca, azərbaycanca, sayt, yüklə, pulsuz, pulsuz yüklə, haqqında, haqqinda, məlumat, melumat, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, şəkil, muisiqi, mahnı, kino, film, kitab, oyun, oyunlar, android, ios, apple, samsung, iphone, pc, xiomi, xiaomi, redmi, honor, oppo, nokia, sonya, mi, web, computer, komputer
Vikipediya azad ensiklopediya Masin oyrenmesi ve intellektual verilenlerin analiziTapsiriqlarTesnifat tapsirigi Reqressiya Neyron sebekeler PerseptronDBSCAN OPTICSFaktor analizi Neyron sebekelerDerin oyrenmeNezeriyyeKonfranslar ve jurnallarArXiv cs LGbr Verilenlerin artirilmasi masin oyrenmesi ve suni intellekt sahesinde modelin oyrenme qabiliyyetini artirmaq ve umumilesdirme ing generalization bacarigini yukseltmek ucun movcud suni sekilde yeni numuneler yaratmaq prosesi Bu usul xususile komputer gorunusu tebii dilin emali ve kimi sahelerde genis istifade olunur Tipik yanasmalara tesadufi firlatma kesme olcu deyisme reng deyisiklikleri ve ses kuy elave edilmesi daxildir Tebii dil emalinda ise sinonim evezlenmesi cumle strukturlarinin deyisdirilmesi ve ya generativ modellerle yeni metnler yaradilmasi istifade olunur Verilenlerin artirilmasi hemcinin derin oyrenme modellerinin hedden artiq oyrenmesinin ing overfitting qarsisini almaga balanssiz melumat destlerini tarazlasdirmaga ve modelin performansini real muhitde yukseltmeye xidmet edir Siqnal emali ucun verilenlerin artirilmasi span Zaman sirasi time series ucun artirma usulu kimi qaliq ve ya blok bootstrap yanasmalarindan istifade edile biler Bioloji siqnallar span Suni verilenlerin artirilmasi xususen yuksek olculu ve az numuneli olan bioloji melumatlar ucun masin oyrenmesinde tesnifatin ing classification keyfiyyetini yukseltmek baximindan boyuk ehemiyyet dasiyir Hem elil hem de saglam sexslerde robot nezareti ve siqnal artirilmasi tetbiqleri hele de esasen subyekte xas analizlere esaslanir Parkinson xesteliyine aid elektromioqrafiya EMG siqnallarinin toplanmasi cetin oldugundan melumat azligi xususi ile nezere carpir Zanini ve hemkarlari generativ adversarial sebeke xususile DCGAN istifade etmekle uslub oturmesi ing style transfer apararaq Parkinson xesteliyine mexsus sintetik EMG siqnallarinin yaradilmasinin mumkun oldugunu gostermisdir Bu yanasmalar elektroensefaloqrafiya EEQ beyin dalgalari ucun de muhum ehemiyyet kesb edir Vanq ve digerleri derin konvolyusion neyron sebekelerden istifade ederek EEQ esasli emosiyanin taninmasi movzusunu arasdirmis ve melumat artirilmasi tetbiq edildikde neticelerin yaxsilasdigini gostermisdir Tez tez istifade olunan usullardan biri real melumatin komponentlerini yeniden tertib etmekle sintetik siqnallar yaratmaqdir Lotte Analogiyaya esaslanan suni sinaq yaradilmasi adli metod teklif etmisdir Bu yanasmada uc numune x1 x2 x3 displaystyle x 1 x 2 x 3 esasinda x3 displaystyle x 3 what x2 displaystyle x 2 nisbeti qeder cevrilme tetbiq olunur ve neticede xsynthetic displaystyle x synthetic adli yeni siqnal formalasir Bu usul Linear Discriminant Analysis klassifikatorunun uc muxtelif verilenler toplusu uzerinde neticelerini yaxsilasdirmisdir Son arasdirmalar gosterir ki nisbeten sade texnikalar bele boyuk tesir gostere bilir Meselen Frir toplanmis verilenlere ses kuy elave etmekle yeni numuneler yaratmagin evvelce zeif netice gosteren bir nece modelin oyrenme qabiliyyetini yukseltdiyini qeyd etmisdir Tsinqanos ve digerleri boyukluk deformasiyasi ing magnitude warping dalgaciq parcalanmasi ing wavelet decomposition ve sintetik sethi EMG modelleri generativ yanasmalar kimi usullari el jestlerinin taninmasi ucun arasdirmis ve artirilmis melumatlarin oyredilme merhelesine elave edilmesi neticesinde tesnifat gostericilerinin 16 dek yaxsilasdigini bildirmisdir Daha sonraki tedqiqatlar generativ modellerin suni melumat yaratmaq ve hemin melumati oyrenme prosesine daxil etmek imkanlarina yonelmisdir 2018 ci ilde Luo ve digerleri Serti Vassersteyn Generativ Adversarial Sebekelerinden ing Conditional WGAN istifade ederek EEQ siqnal melumati yaratmis ve klassik train test cercivesinde telim destine elave etmis neticede tesnifat gostericilerinin yaxsilasdigini musahide etmisdir Mexaniki siqnallar span Verilenlerin artirilmasi esasinda mexaniki siqnallarin proqnozlasdirilmasi yeni texnoloji innovasiyalar enerji paylanmasinin optimallasdirilmasi 5G rabite sahesi ve robot nezaret muhendisliyi kimi istiqametler ucun yeni imkanlar acir 2022 ci ilde Yang ve hemkarlari mekan zaman verilenlerinin korrelyasiyasi ile melumat artirilmasi ve melumatin azaldilmasi ing data pruning yanasmalarini birlesdiren mehdudiyyetler optimallasdirma ve idareetmeni derin sebeke cercivesine inteqrasiya eden metod teklif etmisdir Bu yanasma real senaye layihelerinde derin oyrenmenin interpretasiyasini tehlukesizliyini ve idareolunmasini artirmaq ucun aciq riyazi proqramlasdirma tenlikleri ve analitik hellerden istifade edir Istinadlar span Dempster A P Laird N M Rubin D B Maximum Likelihood from Incomplete Data Via the EM Algorithm Journal of the Royal Statistical Society Series B Methodological 39 1 1977 1 22 doi 10 1111 j 2517 6161 1977 tb01600 x 10 oktyabr 2022 tarixinde arxivlesdirilib Istifade tarixi 28 avqust 2024 Rubin Donald Comment The Calculation of Posterior Distributions by Data Augmentation Journal of the American Statistical Association 82 398 1987 doi 10 2307 2289460 JSTOR 2289460 7 avqust 2024 tarixinde arxivlesdirilib Istifade tarixi 28 avqust 2024 Jackman Simon Bayesian Analysis for the Social Sciences John Wiley amp Sons 2009 236 ISBN 978 0 470 01154 6 Shorten Connor Khoshgoftaar Taghi M A survey on Image Data Augmentation for Deep Learning Mathematics and Computers in Simulation springer 6 2019 doi 10 1186 s40537 019 0197 0 Wang Shujuan Dai Yuntao Shen Jihong Xuan Jingxue Research on expansion and classification of imbalanced data based on SMOTE algorithm Scientific Reports ingilis 11 1 15 dekabr 2021 24039 Bibcode 2021NatSR 1124039W doi 10 1038 s41598 021 03430 5 ISSN 2045 2322 PMC 8674253 bad pmc PMID 34912009 bad pmid Yann Lecun ve b Learning algorithms for classification A comparison on handwritten digit recognition Conference paper nyuscholars nyu edu World Scientific 1995 261 276 Istifade tarixi 14 may 2023 Simard P Y Steinkraus D Platt J C Best practices for convolutional neural networks applied to visual document analysis Seventh International Conference on Document Analysis and Recognition 2003 Proceedings 1 2003 958 963 doi 10 1109 ICDAR 2003 1227801 ISBN 0 7695 1960 1 Hinton Geoffrey E Srivastava Nitish Krizhevsky Alex Sutskever Ilya Salakhutdinov Ruslan R Improving neural networks by preventing co adaptation of feature detectors 2012 arXiv 1207 0580 cs NE Cagli Eleonora Dumas Cecile Prouff Emmanuel Convolutional Neural Networks with Data Augmentation Against Jitter Based Countermeasures Profiling Attacks Without Pre processing Fischer Wieland Homma Naofumi redaktorlar Cryptographic Hardware and Embedded Systems CHES 2017 Lecture Notes in Computer Science ingilis 10529 Cham Springer International Publishing 2017 45 68 doi 10 1007 978 3 319 66787 4 3 ISBN 978 3 319 66787 4 Shorten Connor Khoshgoftaar Taghi M A survey on Image Data Augmentation for Deep Learning Journal of Big Data 6 1 6 iyul 2019 60 doi 10 1186 s40537 019 0197 0 ISSN 2196 1115 Lotte Fabien Signal Processing Approaches to Minimize or Suppress Calibration Time in Oscillatory Activity Based Brain Computer Interfaces PDF Proceedings of the IEEE 103 6 2015 871 890 doi 10 1109 JPROC 2015 2404941 ISSN 0018 9219 3 aprel 2023 tarixinde arxivlesdirilib PDF Istifade tarixi 5 noyabr 2022 Ghorbel Emna Ghorbel Faouzi Data augmentation based on shape space exploration for low size datasets application to 2D shape classification Neural Computing and Applications ingilis 36 17 1 iyun 2024 10031 10054 doi 10 1007 s00521 024 09798 5 ISSN 1433 3058 Anicet Zanini Rafael Luna Colombini Esther Parkinson s Disease EMG Data Augmentation and Simulation with DCGANs and Style Transfer Sensors 20 9 2020 2605 Bibcode 2020Senso 20 2605A doi 10 3390 s20092605 ISSN 1424 8220 PMC 7248755 bad pmc PMID 32375217 bad pmid Wang Fang Zhong Sheng hua Peng Jianfeng Jiang Jianmin Liu Yan Data Augmentation for EEG Based Emotion Recognition with Deep Convolutional Neural Networks MultiMedia Modeling Lecture Notes in Computer Science 10705 2018 82 93 doi 10 1007 978 3 319 73600 6 8 ISBN 978 3 319 73599 3 ISSN 0302 9743 Freer Daniel Yang Guang Zhong Data augmentation for self paced motor imagery classification with C LSTM Journal of Neural Engineering 17 1 2020 016041 Bibcode 2020JNEng 17a6041F doi 10 1088 1741 2552 ab57c0 hdl 10044 1 75376 ISSN 1741 2552 PMID 31726440 Tsinganos Panagiotis Cornelis Bruno Cornelis Jan Jansen Bart Skodras Athanassios Data Augmentation of Surface Electromyography for Hand Gesture Recognition Sensors 20 17 2020 4892 Bibcode 2020Senso 20 4892T doi 10 3390 s20174892 ISSN 1424 8220 PMC 7506981 bad pmc PMID 32872508 bad pmid Yang Yang Wind speed forecasting with correlation network pruning and augmentation A two phase deep learning method Renewable Energy 198 1 2022 267 282 arXiv 2306 01986 Bibcode 2022REne 198 267Y doi 10 1016 j renene 2022 07 125 ISSN 0960 1481 VerilenlerVerilenlerin elde edilmesi Verilenlerin artirilmasi Verilenlerin analizi Verilenlerin anonimlesdirilmesi Verilenlerin arxeologiyasi Boyuk verilenler Verilenlerin temizlenmesi Verilenlerin toplanmasi Verilenlerin sixlasdirilmasi Verilenlerin pozulmasi Verilenlerin kurasiyasi Verilenlerin tekrarsizlasdirilmasi Verilenlerin deqradasiyasi Verilenlerin identifikasiyasinin silinmesi Verilenler ekosistemi Verilenlerin redaktesi Verilenler muhendisliyi Verilenlerin silinmesi Verilenler etikasi Verilenler idareciliyi Verilenlerin idareedilmesi Metamelumatlar Verilenler medenciliyi Verilenlerin mexfiliyi muhafize Verilenlerin berpasi Verilenler elmi Verilenler tehlukesizliyi Verilenler tipi Verilenler xezinesi Diferensial hesablamaEsasObraz tanima nezeriyyesiKonseptlerReqressiya Suni intellektin hallusinasiyasi Sigmoid TenzimlemeTetbiqlerMasin oyrenmesi Suni neyron sebekeler Derin oyrenme Suni intellekt Boyuk dil modeliCihazlarProqram teminati kitabxanalariTetbiq edilmesiAudio vizualOCR Nitqin taninmasi DALL E Midjourney Stable DiffusionSifahiGemini Bard GPT 4 ChatGPT PaLMQerar vericiAlphaGo Ozugeden avtomobil Auto GPTInsanlarDemis Hassabis Ceffri Hinton Yan LekunTeskilatlarAnthropic Google DeepMind OpenAIArxitekturalarPortallar Texnologiya Kateqoriyalar Suni neyron sebekeler Masin oyrenmesi Kateqoriyalar Masin oyrenmesiVerilenler
