7 Bio-Siqnal Əvvəlcədən İşləmə Tövsiyələri: Dərin Öyrənmə Təsnifatçınızın möhkəmliyini necə artırmaq olar

Niyə səs-küy və təhriflə məşğul olmaq bu qədər vacibdir

Tipik olaraq, elektrokardioqrafiya (EKG), elektroensefalografi (EEG), elektromiyografi (EMG) və s. Kimi bio-siqnallarla əlaqəli hər hansı bir təsnifat tapşırığı (anormallıq aşkarlanması) zaman seriyası aşkarlama problemi kimi qəbul edilə bilər.

Karush-Kuhn-Tucker şərtlərinə görə giriş siqnalları dayanma meyarlarına cavab verməlidir. Giriş siqnallarının nümunələri sadəcə siqnalın zamanla paylanmasını dəyişdirmədən bir təlim dəstindəki ilə eyni və ya oxşar olmalıdır.

Bir qayda olaraq, hər bir bio-siqnal qeydləri çox səs-küylə əlaqələndirilir. Bu qərəzlər dayanma meyarlarını pozduqları üçün modelə əlavə fərqliliklər əlavə edirlər.

Bu səslər təbiətə görə dəyişə bilər və daha ətraflı məlumatı burada və burada tapa bilərsiniz. Bu məqalələr EKQ səslərini təsvir edir, eyni zamanda hər hansı bir bio-siqnalda tətbiq oluna bilər.

Dedi ki, DL təsnifatçınızın ümumi performansı əvvəlcədən işləmə texnikasının səmərəliliyi ilə müəyyən edilir.

Gəlin əvvəlcədən işləmə yolu ilə dərin öyrənmə modelinin möhkəmliyini necə yaxşılaşdırmağın mümkün olduğunu görək.

1. Səmərəli rəqəmsal siqnal işlənməsinin 50% -i səmərəli analoq işləmədir

Hər rəqəmsal siqnal emalı səmərəli bir analog siqnal emalı ilə başlayır. Ən ümumi səhv, aliasing problemi ilə bağlıdır.

Nyquist teoreminə görə ADC-nin seçmə dərəcəsi giriş siqnalının ən yüksək tezliyindən iki dəfə yüksək olmalıdır. Hər bir siqnal əsas tezlik diapazonundakı bu kriteriyanın ləqəb adlarına uyğun gəlmir və faydalı ləqəbləri əlavə müdaxilə kimi göstərir:

Bu problemin qarşısını almaq üçün ADC-dən əvvəl analog aşağı keçidli filtr tətbiq olunur. Çox vaxt aparat mühəndisləri sadə bir RC dövrəsini kifayət edir. Bununla birlikdə, mükəmməl və həqiqi aşağı keçid filtri arasındakı tezlik reaksiyası çox fərqlidir:

İdeal (solda) və həqiqi (solda) analog filtrlərin tezlik xüsusiyyətlərindən ibarətdir

Mübahisəli LPF-nizin Nyquist tezliyinin qarşısını alma tələblərinə cavab verdiyindən əmin olun (daha ətraflı məlumat üçün bu kitabı məsləhət görürəm):

  • 8 bitlik ADC üçün 50 dB
  • 10 bitlik ADC üçün 62 dB
  • 12 bitlik ADC üçün 74 dB
  • 16 bitlik ADC üçün 98 dB

2. Təlim və proqnoz vermək üçün eyni aparatdan istifadə edin

Fərqli cihazlar siqnal qeydinin fərqli şərtlərini təyin edir, məs. B. elektronikanın xətti olmayan təhrifi, fərqli mənzil, sensorların fərqli mövqeyi və s.

Fərqli şərtlər fərqli siqnalları təyin etdiyindən, təlim modeli və proqnoz üçün eyni aparatı istifadə etməyi məsləhət görürəm. Bu, təlim dəstindəki əlavə qərəzin səbəbi ola bilər.

Heç bir seçim yoxdursa, məşq dəstini əvvəlcədən əyilməyə cəhd edə bilərsiniz. Lakin bunun üçün əlavə avadanlıq və səs-küy bilikləri lazımdır.

3. Məşqi sürətləndirmək üçün Nyquist teoremi

Yuxarıda təsvir olunduğu kimi Nyquist teoremi, konversiyadan sonra analoq siqnalın 100% məlumatını saxlamaq üçün ADC-nin minimum seçmə sürətini təyin edir. Yəni siqnalın maksimum tezliyi Fs / 2-dən aşağı olarsa, dərin şəbəkə təlimini sürətləndirmək üçün istifadə edilə bilən azalma var.

Nümunəyə baxaq.

EKQ siqnalı, Physionet verilənlər bazası tərəfindən təmin edilən 125 Hz seçmə hızı ilə mövcuddur (30 Hz filtr tətbiq olundu):

EKQ-nin əvvəlcədən işlənməsi üçün məsləhət: EKQ siqnalları 0-100 Hz təyin edir, lakin 30 Hz aşağı ötürücü filtr tətbiq oluna bilər. P və T dalğalarını toxunulmaz saxlayır, lakin R zirvəsinin amplitüdünü 20-30% azaldır. Anormallıq aşkarlanması və ürək dərəcəsi sayılması üçün vacib deyil.

Bu siqnalın güc spektrinin sıxlığı belə görünür:

Yuxarıda göstərildiyi kimi, siqnal enerjisinin böyük hissəsi 0 ilə 30 Hz arasında cəmlənmişdir. Gəlin onu 80 Hz-ə endirək və orijinal siqnalla müqayisə edək:

Dekimasiya effektinin nümayişi: seçmə hızı 80 Hz (yuxarıda) və 125 Hz (aşağıda) olan siqnal

Orijinal forma saxlanılır, lakin siqnalın ümumi uzunluğu% 35-dən 92-ə qədər 59 nümunəyə endirilir. Bu, dəqiqlik itkisi olmadan məşq sürətinin% 35-ə bərabərdir.

Github layihəm bu yanaşmanın nə qədər səmərəli olduğunu göstərir.

Vacib qeyd: qərarınızın aşkarlanması üçün istifadə edilə bilən əlavə detalları itirməməsinə əmin olun. Təcrübə bunu sübut etməyin yeganə yoludur. Bununla birlikdə, praktikada, iki yığılmış (CNN + LSTM) modelləri nümunə götürülmüş siqnallarla öyrətmək, performansı itirmədən orijinal nümunə götürmə dərəcəsi ilə bir modeli öyrətməkdən daha sürətli olur.

4. Sistem üçün tələbləri anlayın

Wavelette və ya Adoptive kimi daha mürəkkəb filtr alqoritmlərini sınamadan əvvəl, aşkarlama üçün hansı funksiyaların lazım olduğunu bilməlisiniz.

Budur bir nümunə.

Deyək ki, dərin öyrənmə modelinin işi yeriyərkən aritmiya aşkarlamaqdır. Tipik olaraq, EKG gəzinti məlumatları aşağı tezlikli səs-küy ehtiva edir:

Bu vaxt aydın EKG siqnalı belə görünür:

P və T dalğaları maskalanır və onları çıxarmaq asan bir iş deyil. Mürəkkəb alqoritmlər hazırlamağa başlamazdan əvvəl aritmiyanın əslində nə olduğuna baxaq:

Aritmiyaların aşkarlanması üçün effektiv detektoru qurmaq üçün yalnız nəbz sayı kifayətdir. Aydındır ki, aşağı tezlikli başlanğıc miqrasiyası dayanıqlılığın pozulması ilə əlavə bir variant əlavə edir.

EKG-nin fərqli hissələri fərqli tezlik diapazonlarını təyin edə bilər:

Sadə 5-15 Hz zolaqlı keçid filtri ekstraksiya R-pik problemini həll edir. Bu filtrin tətbiqi P və T dalğalarını boğur (və bununla əlaqəli anomaliyalar aşkarlanmaq üçün mövcud deyil), lakin sistem üçün tələblər yerinə yetirilir.

Əsas qayda: alqoritm nə qədər mürəkkəbdirsə, o qədər güclü deyil və onu həyata keçirmək üçün daha çox resurs (həm vaxt, həm də pul) tələb olunur. Ən sadə rəqəmsal süzgəc sınanacaq ilk şey olmalıdır.

5. Boru kəmərlərini inkişaf etdirərkən MiniMax prinsipindən istifadə edin

MiniMax prinsipi oyun nəzəriyyəsinin ən yaxşı strategiyasıdır.

Biosiqnallarla bağlı əsas problem zamanla siqnal keyfiyyətindəki dəyişiklikdir:

  • İş 1. Test olunan şəxsin az fəaliyyəti ilə yüksək keyfiyyət:
  • İş 2. Gərgin hərəkət zamanı məlumatların keyfiyyətsiz olması. P və T maskalanır və 1 kanallı sistemlə səs-küydən çıxarıla bilməz:

Birinci halda, P, QRS və T aşkar edilə bilər. Bu, anormal EKG nümunələrinin çoxunun (ürək böhranı, atrial fibrilasiya və s.) Aşkar edilə biləcəyi deməkdir.

İkinci halda, yalnız bir neçə QRS ilə əlaqəli anormallıq (aritmiya və s.) Aşkar edilə bilər.

Yuxarıda göstərildiyi kimi, QRS çıxarmaq üçün ən yaxşı yol 5-15 Hz zolaqlı keçid filtrindən istifadə etməkdir. Bu vaxt P və T bastırılır.

2-ci vəziyyət üçün kritik deyil, çünki P və T səs-küylə örtülür, lakin aşkar olunan mümkün patologiyaların miqdarını məhdudlaşdırır, eyni zamanda girişdə yüksək keyfiyyətli məlumat verir.

Bu problemdən qaçınmanın ən yaxşı yolu, dəyişən mühitə impuls reaksiyasını dəyişdirən adaptiv filtr tətbiq etməkdir:

Fikir sadədir:

  1. Məlumat keyfiyyəti detektoru hazırlayın (xətti detektorlar / CNN);
  2. Bir sıra filtrləri təyin edin.
  3. Giriş siqnalının keyfiyyətindən asılı olaraq impuls cavabının dəyişdirilməsi üçün bir qayda qurun.

6. Yüksək keçid filtrlərindən istifadə etməyin ağıllı yolu

Tipik olaraq, başlanğıc gəzintisini idarə etmək üçün yüksək keçid filtrləmə tələb olunur:

Fon səs-küylü EEG

Aşkar yanaşma yüksək ötürücü filtrdən istifadə etməkdir. Bunun üçün əsas məhdudiyyət çox aşağı bir kəsmə tezliyi (0.05 Hz) və yüksək səviyyədə bir rədddir (> 30 dB). Tələblərə cavab vermək üçün filtrin yüksək əmri olmalıdır, yəni real vaxt tətbiqetmələri üçün uyğun olmaya biləcək uzun bir gecikmə olmalıdır.

Alternativ bir yol:

  • Giriş siqnalını kəsin;
  • 0.05 Hz bir kəsmə tezliyi olan aşağı keçid filtri ilə səs-küy döşəməsini çıxarın.
  • Siqnalı interpolasiya edin;
  • Orijinal siqnaldan başlanğıc xəttini çıxarın

Kod nümunəsi (Matlab) bu ​​GitHub deposunda mövcuddur.

7. Təkrar təcrübə

Hər hansı bir məlumat elmi problemində olduğu kimi, biosignların təsnifatı da təkrarlanan bir eksperimental prosesdir, çünki fərqli filtrasiya yanaşmaları fərqli tətbiqetmələr üçün uyğun ola bilər.

Ən etibarlıdan ən pisə qədər qısa bir filtrləmə texnikasını xülasə etdim.

DİQQƏT: Bu, yalnız mənim şəxsi fikrimdir və sizinlə eyni ola bilməz.

  • Rəqəmsal filtrasiya (FIR, IIR). Qrup gecikmə təhrifinin olmaması səbəbindən FIR tövsiyə olunur. Performans mülayimdir, qeyri-müəyyən şərtlər üçün idealdır, həyata keçirilməsi çox asandır və 100% möhkəmdir.
  • Wavelet filtrlənməsi. Güclü performans, lakin tətbiqetmə seçimi baxımından mürəkkəb ola bilər.
  • Uyğun filtrasiya. Bu metod dalğacıq filtrindən daha zəif performansa malikdir, lakin yaxşı çeviklik və performansla tətbiq edilməsi çox asandır.
  • Müstəqil komponent analizi (ICA) / Kor mənbəyi ayırma (BSS). Ən populyar proqramlaşdırma dillərində Tez ICA alqoritminin tətbiqinə burada tapa bilərsiniz. Son sınamağı məsləhət görərdim, çünki:
  1. Yalnız çox kanallı konfiqurasiyalarla işləyir.
  2. Bu yaxınlaşmanın təmin olunmadığı üçün bu yanaşmanın möhkəmliyini çox zəif gördüm.
  3. Nisbətən daha çox hesablama mənbəyi tələb edir və real vaxt tətbiqləri üçün uyğun olmaya bilər.

___________________________________________________________________

Kağızı faydalı hesab etdiniz? Xahiş edirəm bu linkdən istifadə edərək məqalə ilə bağlı rəylərinizi bildirin

___________________________________________________________________

Dmitrii Shubin, Ar-Ge mühəndisi, tibbi cihazlar

Toronto, ON, Kanada

Əlaqə məlumatı:

Elektron poçt: [email protected]

LinkedIn, GitHub