custom software development services for usa, offshore software development israel, offshore web development company israel, custom software development company in germany

זיהוי הפעלות האק"ג החזקות ביותר

מקרה של לימוד מכונה ברפואה

הבנת המשימה

לקוח
Biosense Webster, חלק ממשפחת חברות Johnson & Johnson, ישראל.
היקף
בניית מודל לגילוי עירור לב (להלן: הפעלה) באמצעות רשתות עצביות.
פרטים
הצנתרים של Biosense Webster מייצרים מידע הטרוגני, כולל אותות אלקטרוקרדיוגרמה.

אותות האלקטרוקרדיוגרמה מהאק"ג מסייעים לקרדיולוגים להבחין בנקודות (ייחוס) ספציפיות התואמות לכמה אירועים פיזיולוגיים, למשל רגע התכווצות שריר הלב.

נתוני מקור

הלקוח סיפק מערך נתונים מתויג של אותות אק"ג חד קוטביים ודו קוטביים
9
קובצי RAR המכילים
~ 400 000
קטעי אק"ג, שכל אחד מהם בפורמט
+ 1 secret
קובץ RAR סודי אחד עם ~ 400,000 קטעי אק"ג
קטעי האק"ג נאספו ממכשירים שונים בשלבים שונים של הפיתוח הטכנולוגי. האותות הגיעו ממטופלים שונים – בריאים ובעלי פתולוגיות

תיוג

המשימה היא לזהות את ההפעלה (רגע התכווצות שרירי הלב)
כל קטע אק"ג מכיל 2.5 שניות (2500 מילישניות). חלונות העניין וההפעלה מתויגים בכל קטע אק"ג.

הגדרת הבעיה בשני שלבים

קריטריונים להצלחה בשלב 1

פונקציית הפסד

פתרנו את בעיית זיהוי ההפעלה בקטע האק"ג כמשימת סיווג עם 2500 סוגים (מספר הסוגים שווה לאורך קטע האק"ג, 2500 מילישניות), כאשר 0 הוא אין הפעלה, 1 הוא הפעלה. המשימה הייתה לחזות את ההסתברות להפעלה בכל מילישנייה ולבחור נקודה עם ההסתברות המרבית. פונקציית ההפסד היא אנטרופיה צולבת קטגורית.

אופן אימות המודל

בשלב הראשון של הפרויקט, יושמו מספר אסטרטגיות אימות באופן איטרטיבי, בתלות במטרות. האסטרטגיה המוצגת להלן מאפשרת את הערכת השפעת גודל מערך נתוני התרגול על דיוק המודל.
מערך נתוני התרגול
שלב 1 קובץ 1 שלב 2 קובץ 1 קובץ 2 … שלב 7 קובץ 1 קובץ 2 קובץ 7
מערך נתוני הפיתוח
שימש לבדיקת המודל במהלך תהליך הפיתוח
מערך נתוני האימות
שימש לאימות המודל לאחר הפיתוח על מנת למנוע אפקט התאמת יתר

דיוק המודל וגודל מערך הנתונים

הלקוח סיפק מערך נתונים מתויג של אותות אק"ג חד קוטביים ודו קוטביים
התוצאות הטובות ביותר הושגו במהלך תרגול המודל עם 2.8 מיליון קטעי אק"ג גודל התרגול = 2.8 מיליון דיוק 1 = 97% דיוק 5 =

קריטריוני הקבלה הושגו במהלך תרגול המודל עם 0.8 מיליון קטעי אק"ג גודל התרגול = 0.8 מיליון דיוק 1 = דיוק 5 =

גודל מערך נתוני האימות הוא קבוע: 400 אלף קטעי אק"ג

האם המודל יציב?

תרגלנו את המודל עם מערכי נתונים 1-2 (שם הגענו לקריטריוני הקבלה) ומצאנו הפעלות בכל קטעי האק"ג ממערכי הנתונים 3 9, כמו גם במערך הנתונים החסוי.
95 % דיוק >
בכל מערכי הנתונים כולל החסוי

יכולת החיזוי של המודל זהה
מעבר לשלב 2
זמן הביצוע של המודל (חיזוי נקודת ההפעלה לאות יחיד) לא יעלה על 20 מילישניות. שפת С משמשת בסביבת הייצור שהקוד ישולב בה.
המודל הגיע לקריטריוני הקבלה

מהירות חיזוי ממוצעת

המהירות חושבה בעזרת 2000 אותות
מהירות חיזוי קבילה 20 מילישניות
תוצאות הפרויקט
400 אלף קטעי אק"ג מספיקים למודל למידה עמוקה כדי לזהות הפעלה ברמת דיוק של 95%
מודל הלמידה העמוקה שפותח בשפת C מספק את החיזוי תוך 7 מילישניות במעבד ותוך 2 מילישניות במעבד גרפי
טכנולוגיית הלמידה העמוקה פתרה את הבעיה בפחות משלושה חודשים, המהירה פי 5 ויותר מפיתוח של אלגוריתם המבוסס על היוריסטיקה עסקית ומסננים

מחפש שותף אמין לפיתוח תוכנה? צור קשר עם Fayrix עוד היום!