תכנון מולקולרי ממוחשב באמצעות חתימת מתאר מולקולרי – יישום לבחירת ממס
מאת: דרק סי. וייס ו דונאלד פי. ויסקו
המחלקה להנדסה כימית, האוניברסיטה הטכנולוגית טנסי, Box 5013, קוקוויל, TN 38505, ארצות הברית
תקציר:
ישנו ביקוש הולך וגדל לפתח ממסים ידידותיים יותר לסביבה על מנת להפחית עלויות וכדי לעמוד בדרישות הרגולציה. חוקרים ב- GlaxoSmithKline ) GSK) פיתחו מדריך לבחירת ממס המדרג 47 ממיסים בשימוש נפוץ בין 1 ל 10, בחמישה תחומים הקשורים לתאימות סביבתית. בעבודה זו, אנו מיישמים תכנון מולקולרי ממוחשב המכונה עיצוב הפוך בחתימת מתאר עם חתימה מולקולרית לזיהוי ממסים ירוקים נוספים, שעלולים להיות מחוץ לרשימת ה-GSK. עם יישום זה, הגישה הרבה יותר מהירה, פחות יקרה ומאפשרת חיפוש מקיף יותר אחר מועמדים מתאימים מאשר לעבוד עם נתונים מניסויים בלבד. אנו מציגים את התוצאות של הממסים עם התכונות החזויות האופטימליות מבין 47 התרכובות במדריך ה-GSK הכולל כמה סוגי כלאיים מוצלבים. בנוסף, הטכניקה שלנו “מגלה מחדש” את הממס הירוק המומלץ באמצעות שיטה זו על ידי שילוב של סוגי ממס שונים.
1. הקדמה
באופן כללי, ממס הוא חומר מומס (מוצק,נוזל או גז) ליצירת תמיסה. יש לייצר ממיסים טובים שישמשו במהלך חיי היומיום. הממס הנפוץ ביותר הוא מים. דוגמאות נפוצות נוספות בהן נדרשים ממסים כוללות ניקוי יבש, שומנים, שומנים, דבקים וטקסטיל (Gani et al.,
2006). ממסים ממלאים שנים רבות תפקיד חשוב בתהליכים כימיים ובתעשיות תרופות , עם זאת, הולכת וגוברת הדרישה למזער את השימוש בממסים מסוימים או להחליף אותם בשל הוצאות גבוהות. הוצאות אלה יכולות להיות מסיבת בעיות בריאות ובטיחות (EHS) הקשורות לרעילות או פינוי פסולת (Curzons, Constable, & Cunningham, 1999). לדוגמה, אם לא ניתן לבצע מיחזור ממס, שריפה של החומר תיתכן ותיהיה מלווה בעלויות נוספות בגלל מחירי אנרגיה גבוהים. השימוש בממיס חלופי יכול להוות חלופה.
לפיתוח מוצרים, מהנדסים כימיים חייבים לקחת בחשבון סוגיות אלה ולעשות את הבחירה הטובה ביותר האפשרית. על מנת לעזור לכימאים ומהנדסים לבחור ביתר קלות, החוקרים ב-GSK פיתחו מדריך לבחירת ממס (Curzons et al., 1999). המדריך משמש כמקור תמציתי של מידע על 35 ממסים נפוצים, ונועד להוסיף את הנהלים הקיימים הכרוכים במהלך בחירת הממס בתחילת תהליך הפיתוח. המדריך מאפשר לקחת בחשבון את מגוון מאפייני הממס, חששות טכניים ועלויות סטנדרטייות. תשע הקטגוריות הבאות נחשבות כחשובות ומופיעות במדריך: שריפה, מיחזור, טיפול ביולוגי, פחמן אורגני נדיף, השפעת המים סביבתית, השפעת האוויר על הסביבה, מפגעי בריאות, פוטנציאל החשיפה ומפגעים בטיחותים (Curzons et al., 1999). בכל אחד מהקטגוריות שניתנו, נכללו מאפיינים חשובים. לדוגמה, המאפיינים הרלוונטיים לקטגוריית השרפה היו חום הבעירה ופליטת השריפה. כל המאפיינים נבחנו ודורגו בסולם מ -1 עד 10. בכל המקרים במחקר זה שנערך על ידי ה-GSK, הציונים הגבוהים מעידים על ממס מעולה. הפשט נעשה כדי להקל על השימוש במדריך לחסרי המומחיות הסביבתית, הבריאותית או הבטיחותית. תשע הקטגוריות המקוריות שולבו והופחתו לארבע קטגוריות חדשות (אזורים): פסולת, השפעה, בריאות ובטיחות. באופן ספציפי, הקטגוריות של שריפה, מיחזור, טיפול ביולוגי, ושילוב פחמן אורגני נדיף יצרו את אזור הפסולת. אזור ההשפעה מיזג את ההשפעה הסביבתית של המים והאוויר ואילו אזור הבריאות כלל את הקטגוריות הפוטנציאליות למפגעים וחשיפה. לבסוף, אזור הבטיחות כלל רק את קטגוריית סכנות בטיחות.
הפרסום הראשון של מדריך הבחירה בממסים של ג’י.אס.קיי (Curzons ואח ‘, 1999) הורחב מ -35 הממסים הראשונים לסך כל ה-47 (Jiménez-González, Curzons, Constable, & Cunningham, 2005).
טבלה 1
בנוסף, נוסף אזור חדש המכונה הערכת מחזור חיים (LCA) שלוקח בחשבון את ההשפעות הרחבות של ייצור, מיחזור וסילוק. LCA הוא חשוב מכיוון שהוכח בעבר כי השימוש בממיס דורש כמות משמעותית של אנרגיה וטיפול בפליטות גזי חממה בייצור תרופה פעילה (ג’ימייז-גונזאלז, כורזונס, קונסטבול וקנינגהם,2004). הציונים עבור 47 הממסים מוצגים בטבלה 1 עם שני רכיבים, מספרי (1–10) וקוד צבע (ירוק, צהוב, או אדום). ( כפי שדווח על ידי Jiménez-González et al. 2005). לכל ממס עם דירוג ירוק היו ציונים שנעו בין 8 ל -10, דירוג צהוב ניתן מ -4 עד 7, ודירוג אדום שמור ל ממסים עם ציונים של 3 ומטה. לכל חמשת האזורים בטבלה 1, היה רצוי לקבל דירוג ירוק. לממסים עם דירוג LCA אדום, חשוב במיוחד למזער את כמות הממסים הטריים הנדרשים על ידי שימוש בטכניקות מיחזור בתהליך. אם ממס הינו בעל ציון מחזור חיים נמוך, אז ממס חלופי יכול להיות הבחירה הטובה ביותר (ג’ימייז-גונזאלז ואח ‘, 2005).
המדריך לבחירת ממס שפותח על ידי GSK אינו מציין שלא ניתן להשתמש בממיס מסוים, אלא במקום זאת
לשקול ביעילות את היתרונות והחסרונות הפוטנציאליים. בעוד שהמדריך הוא כלי שימושי, הוא אינו האפשרות היחידה שזמינה למציאת חלופה. גני ואח ‘. (2006) לאחרונה בדק כמה טכניקות עדכניות זמינות לזיהוי מועמדים פוטנציאליים כחלק מהליך כללי בבחירת ממס. במצבים מסוימים ניתן יהיה להשתמש בממיס מתהליך דומה בטכניקה המכונה benchmarking. בנוסף, ההסתמכות על האינטואיציה הכימית והניסיון הקודם של אנשי מקצוע היא אפשרות נוספת לבחירת ממס. כמו כן, אם יש צורך במאפיינים ספציפיים, ניתן יהיה לבצע חיפוש במסד הנתונים כדי למצוא ממיסים הידועים כבעלי תכונות דומות שיהיו זמינים.
לבסוף, ניתן לזהות ממסים פוטנציאליים גם בטכניקה הנקראת תכנון מולקולרי בעזרת מחשב-CAMD, והיא למעשה העיקר בעבודה הנוכחית. בעיית ה-CAMD מתחילה בקבוצת אבני בניין בגודל מוגדר, כאשר המטרה בסופו של דבר היא יצירת מבנה מולקולרי שלם שיש לו את אותם המאפיינים. ה-CAMD הוא למעשה ההיפך משיטות הניבוי העוסקות במבנה בפועל, תוך כדי שימוש במודל כדי להעריך את הנכסים (כמו אלה שנמצאים בסימולטורי תהליכים מסחריים). ישנן דוגמאות ל- CAMD בספרות לעיצוב ממסים (חן, ליי, לי, &
לי, 2005; Cismondi & Brignole, 2004; Song & Song, 2008), בנוסף ליישום במגוון תחומים אחרים כולל מעבר של זרזי מתכת (לין, חוואלי, קמרדה ומילר, 2005), מקררים (Sahinidis, Tawarmalani, & Yu, 2003), ותרופות(Siddhaye, Camarda, Southard, & Topp, 2004; Siddhaye, Camarda,
Topp, & Southard, 2000). מתודולוגיית CAMD שימשה ע”י ( Constable 2005 Gani, Jiménez-González,) לבחירת ממיסים לקידום תגובות אורגניות בשלב הנוזל. מטרת המחקר הייתה לספק רשימה תמציתית של כימיקלים שיוערכו על ידי מערכת ניקוד כממסים פוטנציאליים לתגובה מסוימת. דבר זה הושג תחילה באמצעות שיטה שפותחה בעבר על ידי הרפר וגני (2000) לבניית מולקולות יציבות. ערכים של הנכס רלוונטי התקבלו ממאגרי נתונים קיימים, כאשר היו זמינים, או תחזיות שחושבו באמצעות תכנון ממוחשב משולב מערכת סיוע (https://www.capec.kt.dtu.dk/Software/ICAS-and-
its-tools /). השיטה לבחירת ממסים בתגובות אורגניות לאחרונה הורחבה וכוללת גם מערכות תגובה מרובות שלבים והחלפות ממס (Gani, Gómez, Folic, Jiménez-González, & קבוע, 2008).
(Camarda and Sunderesan 2005) השתמשו בשיטת CAMD כדי לזהות מוצרים בעלי ערך שניתן לסנתז מהם שמן סויה. דוגמאות ניתנו לתכנון תוסף דלק, חומר לשטח טקסטיל וחומר לניקוי דלק. הטכניקה התבססה על תוכנית לינארית מעורבת עם מספר שלם ומדדי קישוריות. קשרי מבנה-רכוש כמותיים (QSPR) נוצרו לצורך חיזוי איזון הידרופילי-ליפופילי, ריכוז, סיכה, מתח פנים וזמן הרטבה. חלקים מסוימים של תרכובות שתוכננו פורטו בתהליך שנקרא תבנית כדי להפחית את מורכבות החיפוש. בנוסף, התבנית איפשרה לרכיבים משמן פולי סויה להשתלב ביותר קלות. החיסרון העיקרי בעיצוב התבניות הוא שסביר להניח שמועמדים לא אינטואיטיביים יוסרו מהשיקול. גישה שונה במקצת ל- CAMD פותחה במהלך עשור זה באמצעות המתאר החתימה המולקולרית בטכניקה מסוג עיצוב הפוך-QSPR (ויסקו, פופל’ה, רינטול ופולון,2002). הגישה מכונה עיצוב הפוך מכיוון שקודם מציינים את ערך הנכס (או טווח) ואז מבצעים חיפוש כדי לזהות מבנים פוטנציאליים שיספקו את התוצאה הרצויה. מתאר החתימה המולקולרית הוא מתאר מבוסס שברים המקודד את הסביבה המקומית סביב אטום במולקולה. מאפיין מרכזי ביישום של CAMD עם מתאר החתימה המולקולרי של
(Visco et al., 2002) הוא שהוא אינו דורש תבניות כדי להגיע למבנים מולקולריים. אכן, זוהי הדרך הישירה לעבור מחתימות (אבני בניין של CAMD) אל מבנים בפועל המשתמשים באלגוריתם יעיל הנגזר מתורת הגרפים (Faulon, Churchwell, & Visco, 2003). לעיצוב הפוך, רק שילובים אפשריים של חתימות נחשבים כמבנים וזאת על ידי פתרון המשתמש בקבוצה של משוואות כדי להתמודד עם האילוץ לאכוף את דרישות הערכיות והעקביות (Churchwell etal., 2004). חתימה המשמשת בעיצוב הפוך היא כלי יעיל עבור תכנון מולקולרי מכיוון שניתן להשתמש בחתימה הן לייצור מבנים והן להערכת נכסים. מופעי חתימה מתואמים עם נתונים ניסיוניים עבור נכס בעל עניין ליצור QSPR. דירוג פתרונות למשוואות האילוץ עם QSPRs מצמצם עוד יותר את מספר המבנים הפוטנציאליים החדשים. אלגוריתם העיצוב ההפוך עם החתימה אינו תלוי בבעיה ויושם בעבר באזורים אחרים. המחקר הראשון ליישום טכניקה זו התמקד בעיצוב יותר מעכבי ICAM עוצמתיים (Churchwell et al., 2004). שם נבחרו תרכובות ממסד נתונים ממוקד, סונתזו ובאופן ניסיוני אישרו את החיזויים שנעשו באופן תיאורטי. למעשה, התרכובות החדשות היו יותר פעילות ביולוגית מכל האחרות במערך הניסויים שהוגדרו כהצלחה גדולה של הטכניקה. נעשה שימוש גם בחתימה לעצב רכיבי ניפוח קצף ידידותי לסביבה (ווייס,Faulon, LeBorne, & Visco, 2005), פולימרים (בראון, מרטין, רינטול,& Faulon, 2006) וליגנדים לקולטני גלוקוקורטיקואידים (ג’קסון, ווייס,& Visco, 2008).
בעבודה זו אנו מיישמים את טכניקת ה-CAMD תוך כדי שימוש בחתימת מתאר מולקולרי לזיהוי פוטנציאלי חדש של ממסים ידידותיים לסביבה כתוספת למדריך לבחירת הממס של GSK . QSPRs המשתמשים בחתימה נוצרו כדי לדרג את הפתרונות ההפוכים לבזבוז סביבתי, ההשפעה על הסביבה, בריאות, בטיחות, ו- LCA. יש לציין כי זהו המחקר הראשון של ה- CAMD שכלל חתימת פרופיל כה גבוהה (ממסים) בשימוש בנתונים מגוונים. כמו כן, מאמר זה מגדיר בסעיף 2, את טכניקת העיצוב ההפוכה הכללית שמוצגת יחד עם דוגמא פשוטה, דבר המאפשר לקורא לשחזר ידנית את התוצאות מהדוגמה לשם הבנה מעמיקה יותר של המתודולוגיה הנהוגה. התוצאות מפיתרון הבעיה ההפוכה של התרכובות במדריך לבחירת הממס של GSK מופיעים בסעיף 3. א. מדגם של תרכובות ממאגר הפוטנציאל הממוקד ניתן עם התחזיות המקבילות המתקבלות מ- QSPRs. דיון על התרכובות נמצא בתוך פרק 4, ואחריו סיום מחקר זה בסעיף 5.
2. מתודולוגיה
טכניקת העיצוב ההפוך מתחילה בחיפוש ספרותי באיסוף נתונים על ניסויים שבוצעו על המאפיינים במבנים תואמים. בסיום האלגוריתם, מתקבל מסד נתונים ממוקד של תרכובות המותאמות באופן ספציפי למטרה. כאמור, הטכניקה אינה ספציפית לסוג הבעיה. על מנת להעניק לקורא הבנה מעמיקה יותר של הטכניקה אנו מציגים דוגמא פשוטה לכך. יצירת משוואות האילוץ הנובעות ממסד נתונים המורכב משני תרכובות בלבד: n-pentane ו- fluorobenzene. במציאות, בדרך כלל לא יבוצע עיצוב הפוך המבוסס על שתי תרכובות, אך גם מערכת קטנה תאפשר הדגמה תמציתית של הטכניקה.
2.1. חתימה
חתימת המתאר המולקולרי היא כלי רב עוצמה לקידוד הסביבה המקומית של המולקולה. הגודל המקומי של הסביבה נקבע על ידי פרמטר שצוין על ידי המשתמש ונקרא גובה החתימה, חתימה אטומית היא תת-גרף שבמרכזו אטום שורש ספציפי, וכולל את כל האטומים / הקשרים המשתרעים לגובה המוגדר מראש, ללא מעקב אחריהם. חתימת האטום של גובה h ניתנת רשמית כ- hG (x) לאטום השורש x של הגרף הדו-מימדי G = (V, E). יש לשים לב ש- V, E מתייחס לקבוצת הקודקוד (אטום) וקצה (אג”ח), בהתאמה. כמו כן יש לציין שאם מישהו מעוניין בגובה 0, חתימת האטום תהיה כסוג האטום.
שתי דוגמאות לחתימות אטומיות בגובה 1 מובאות ב איור 1 ל (א) n-pentane ו- (b) fluorobenzene. אטום השורש שצוין בדוגמה עבור n-pentane הוא הפחמן הסופי (בתיבה), שהיא קשורה אחת לשלושה אטומי מימן ואטום פחמן נוסף (מוצג באדום באיור).
תרשים A+B
כך, החתימה האטומית בגובה 1 לאטום השורש הזה הוא [C] ([C] [H] [H] [H]). בחתימה האטומית הסוגריים מציינים עד כמה רחוק אטום מסוים מאטום השורש תוך כדי קישור בין האטומים שניתן על ידי המונח הבא: קשר כפול (), קשר משולש (t) וקישור ארומטי (p), כאשר הקשר היחיד הוא ברירת המחדל (ואין להם סמל קישור). לגבי הפלואורובנזן אנו מתמקדים באטום הפחמן בזירה אשר נקשר ארומטית לשני אטומי פחמן אחרים וקשורים לפלואור. חתימת האטום עבור שורש זה הוא [C] (p [C] p [C] [F]). התרגום המלא לחתימה כולל קביעת חתימה אטומית עבור כל האטומים במתחם. החתימה המולקולרית היא סיכום של כל החתימות האטומיות ומוגדרות רשמית כ-
נוסחה-1
אותה חתימה אטומית יכולה להיות קיימת יותר מפעם אחת בכל מתחם נתון. לדוגמה, [H] ([C])] מופיע שנים עשר פעמים בנפנטן, בעוד שהוא מופיע חמש פעמים בפלואורובנזן. החתימות האטומיות נוצרות באמצעות מתרגם פנימי המסוגל לטפל בפורמטים שונים של קלט (SMILES, MOL וכו ‘). אנחנו רואים את החתימה המולקולרית בגובה 1 (שזה רק סכום של חתימות האטום) לשני החומרים באיור 1. לאחר שתורגמו כל התרכובות בנתונים הראשוניים, בסיס הנתונים של כל החתימות האטומיות הייחודיות בגובה הרצוי, נאסף על כל מערך הנתונים. כהמשך לדוגמה שלנו, עבור n-pentane ו- fluorobenzene, יש בסך הכל 29 חתימות אטומיות בגובה 1. מכיוון שרבות חוזרות על עצמן, ישנן רק שש חתימות אטומיות ייחודיות בגובה 1 לשני מתחמים זה ואלו מורכבים במסד הנתונים בטבלה 2. לכל אחת מהחתימות האטום הייחודיות מוקצה משתנה למטרות זיהוי.
ישנן שתי סיבות עיקריות ליצירת מאגר חתימות אטומי: (1) שמקורו במשוואות האילוץ ו- (2) ובניית מטריצה של המתאר. שתי סיבות אלו נלקחות בחשבון להלן על ידי המשך עם n-pentane ו fluorobenzene
דוגמא.
טבלה 2
מאגר חתימות האטום בגובה 1 שנאסף מנפטאן ופלואורובנזן. מספר המופעים המינימלי והמקסימלי עבור כל חתימה אטומית במולקולה נתונה.
2.2. משוואות אילוץ
קבוצה של משוואות אילוץ של דיופנטין (מקדמים שלמים ומספרים) נובעת ממאגר החתימות האטומיות.
המטרה היא למצוא את כל השילובים האפשריים של החתימות האטומיות הזמינות לשחזור, בכדי לספק מבנים פוטנציאליים חדשים. פתרון המשוואות מאלץ אכיפה של ההגבלות המשכללות את מרחב הפתרונות רק לשילובים של חתימות אטומיות, המסוגלות ליצור מבנה ממשי. שתי צורות של אילוץ משוואות פותחו בעבר (Churchwell et al.,2004), ספציפית, משוואות גרפיות ומשוואות עקביות. משוואות גרפיות היא תנאי הכרחי לקביעה האם ניתן ליצור גרף מחובר? דבר זה מבוסס על דרגת הקודקודים מהגרף והוא נגזר ממסד נתונים של גובה 0 בחתימות האטומיות. המספר הכולל של כל מעלות הקודקוד חייב להופיע ומספר קודקודי התואר המוזרים חייב להיות שווה. המקדמים במשוואה זו הם שניים מינוס תואר הקודקוד עבור חתימה אטומית ספציפית כפי שמוצג מהצורה הכללית בשווה ערך (2).
נוסחה-2
להלן תאור הקודקוד, ו- n הוא מספר הקודקודים עם התואר i. יש לשים לב כי ( “% 2” ב- Eq.2) מציין משוואה שתבטיח כי הדרגה הכוללת של הקודקודים תהיה שווה. הגובה של החתימות האטומיות 1 מלוח 2 מצטמצמות לגובה 0 בחתימות האטומים ליצירת המשוואה הגרפית שניתנה באיור 2. בבדיקה, אנו רואים בחתימה המולקולרית של n-pentane כפתרון וקטור, [x1, x2, x3, x4, x5, x6] = [3 2 0 0 0 12]. המספרים כאן תואמים להתרחשות בחתימות האטום מלוח 2 ב- n-pentane. חיבור הערכים עבור n-pentane לגרפים במשוואת ity מביא לערך של אפס המספק את דרישת המודל. ניתן היה לצפות ש- n-pentane יספק את המשוואות הגרפיות שכן הוא שימש לפיתוח בסיס הנתונים של החתימה.
מצד שני, יש לשקול את פתרון הוקטור הבא, [03000 9], שאינו אחד משני התרכובות בדוגמה זו, שלמעשה מגיע ממולקולת אתאן עם אטום x2 נוסף
איור 2. משוואות אילוץ הנגזרות מהגובה 1 חתימות שנאספו
n-pentane ו fluorobenzene. “P” מציין את הקשר הפחמן-פחמן הארומטי.
חתימה שלא ניתנת לחיבור ובכך היא מנותקת גרף, החיבור של ערכים אלה לתוצאות המשוואה הגרפית
בערך של -1, אינו עומד בתנאי mod 2. כאשר נוצרת חתימה מולקולרית, הקשר בחתימה אטומית אחת יהיה קשר מקביל בחתימה אטומית אחרת, אבל זה יהיה בסדר הפוך. בהתאם לכך, משוואות האילוץ שנותרו, אוכפות דרישה זו והן קבוצה ידועה כמשוואות העקביות. החיפוש מבוצע דרך מסד נתונים בעל חתימה אטומית שלמה על מנת לזהות את כל סוגי הקשר משורש x ל- y. המשוואה נגזרת לכל סוג קשר מכיוון שמספר הקשרים הכולל משורש x חייב להיות שווה למקרה של שינוי, אשר ניתן רשמית להלן ב- Eq. (3).
נוסחה-3
חתימת הקשר הינה גובה אחד פחות מהמפרט המקורי מכיוון שהשינוי נחקר רק לגובה h – 1. המקדמים למשוואות העקביות הינם פשוט מספר הפעמים שהקשרים בשכבה (3) מתרחשים בחתימות האטומיות. משוואת העקביות הראשונה באיור 2 אחראית לפחמן ל קשרי מימן. בהתאם, לחתימה האטומית x1 יש מקדם −2, ולחתימה האטומית x6 יש מקדם של 1 כי זה המקרה לשינוי. יש לשים לב כי חתימת האטום
x3 לא מופיעה במשוואת העקביות הראשונה מכיוון שלא קיים קשר לפחמן ולמימן. במקרה אשר x = y בפנים שווה ערך (3), מספר החיבורים חייב להיות שווה וליצור מודל של משוואה. לדוגמה, משוואת העקביות השלישית והרביעית שתיהן מודולריות מכיוון שהן אחראיות לקישור לפחמן באופן ארומטי וקישור יחיד לפחמן בהתאמה. לבדיקה נוספת, אם נחבר את וקטור הפיתרון עבורfluorobenzene, [0 0 1 5 1 5], לכל משוואות העקביות ב איור 2, הן יהיו מתאימות.
פיתרון לבעיית העיצוב ההפוך חייב לספק את כל הדברים מהמשוואות העקביות ומהמשוואות הגרפיות. פיתרון של כל מערך משוואות האילוץ הוא משימה מאתגרת. הבעיה לא צויינה מכיוון שיש יותר נסתרים מאשר משוואות דבר המביא למספר אינסופי של פתרונות. הזמן הנדרש לפתרון משוואות האילוץ ואחסון הפתרונות הם שתיי סוגיות שיש לטפל בהן בהתאם לגודל המערכת. יישומים קודמים של עיצוב הפוך העובדים בגובה 1 (Churchwell et al., 2004; Weis et al., 2005) הוחלו עם אלגוריתם שפותח על ידי Contejean ו- Devie (1994), עם אילוצים משתנים המבוססים על המינימום והמקסימום של ההתרחשות בערכי החתימות האטומיות בניסויים שנעשו לאחר שהתקבלו הפתרונות. לאחרונה היה צורך לפתור את הבעיה ההפוכה בגובה 2 (Jackson et al., 2008) ובשל כך משוואות האילוץ היו מורכבות יותר מהמערכות שפותחו בגובה1. האלגוריתם של קונטז’יין ודווי לא עבד כראוי והוחלף בשיטת כוח ברוט. שיטה זו הינה גישה איטרטיבית מותאמת ומכוונת על פי ערכי המופע המינימלי והמקסימלי של חתימות האטום במערך הניסויים. ההתמקדות בפתרונות בשטח צמצמה משמעותית את שטח הדיסק הנדרש לאחסון. כדוגמה ליישום פשוט לשיטת כוח הזרוע, נפנה שוב לאיור 2 המפרט חמש משוואות אילוץ. באופן מעשי, שיטת כוח הזרוע ננקטת כדי לספק את משוואות האילוץ כך שהאיטרציות הכרוכות במשתנים אלה המתרחשים במשוואות עוברים לפחות לרוב האיטרציות. לדוגמא, משוואת הקשר CF-CF באיור 2 תיבדק תחילה מכיוון שהמשתנים המעורבים באותה משוואה (x3 ו- x5) כל אחד בלבד בטווח של 0–1 במערך הדגימה הדו-מורכב הזה (ראה טבלה 2). אם הפיתרון מספק את ( Eq. 3) לטווחים של x3 ו- x5 שנחקרו, הוא יתקרב למשוואה הדורשת כמה שפחות יחודיות איטרציות, שהיא למעשה משוואת הקשר C – pC. דבר זה זה ימשך עד כל המשוואות נבחנות. יש לשים לב שאם הטכניקה שלנו הייתה באמת כוח ברוט, היינו חוזרים על ערכי המינימום/מקסימום עבור כל אחד מששת המשתנים בלולאה המקוננת. מספר האיטרציות יהיה אז רק התוצר של הטווח עבור כל אחת מששת המשתנים, כאן 4 × 3 × 2 × 6 × 2 × 8 = 2304.
היישום שלנו, עם זאת, מקטין זאת ביותר ממחצית (לבעיה זו) ל 988 איטרציות.
2.3. פתרונות דירוג עם QSPRs
הפתרונות ההפוכים המתקבלים מפתרון משוואות האילוץ הם למעשה מבנים פוטנציאליים חדשים, אך חסרי משמעות בלעדי דרך לפצח אותם. QSPRs הם כלי יעיל לדירוג מהיר של הפתרונות ההפוכים ונוצרים על ידי מתאם בין המידע בחתימת האטום עם המאפיין של עניין תוך כדי שימוש ברגרסיה לינארית מרובה (MLR) (Draper & Smith, 1998). נוצרת מטריצה של מתאר במקום בו השורות הן התרכובות והעמודות הן חתימות האטום הייחודיות עם הערכים, כאשר המטריצה היא מספר המופעים של אטום מסוים עם חתימה במתחם מסוים. בהתאם, המשתנים העצמאים ב- QSPR הם למעשה המופעים של חתימות האטום והמשתנה התלוי הוא המשתנה בעל העניין. צעדו קדימה של ה- MLR מתחיל באפס משתנים בלתי תלויים ומוסיף חתימה אטומית אחת בכל שלב לבניית המודל הסופי. כל שלב במהלך ה- MLR מציע דגם אחר שיכול היה לשמש כדי לדרג את הפתרונות ההפוכים. בחירת הדגם האופטימלי מה- MLR וכן את תת המשנה הטובה ביותר מבין החתימות האטומיות, היא החלטה חשובה שצריך לקבל. הערך R2, המודד את המתאם בין המודל שחזה את ערכי המשתנה תלוי בערכי המשתנה התלוי הניסוי, שלמעשה יתרחבו ככל שמתווספים משתנים עצמאיים יותר ל- QSPR. עם זאת, ערך R2 גבוה אינו מבטיח מודל חזוי מחוץ לניסויי המקור בגלל תופעה ידועה כמו התאמה יתר על המידה (הוקינס, 2004). טכניקה סטטיסטית המכונה תוקף צולב חופשי-אחד-החוצה, משמשת להערכת מודל להתאמה יתר (Hawkins, Basak, & Mills, 2003).
כדי לחשב מדד זה, כל מתחם במערך הניסויים מוסר ברצף בכדי לשוב ולהתקין מקדמי רגרסיה עבור מערך הניסויים של תרכובות n, שם ייווצרו דגמים שונים. תחזית נעשית עבור כל ה- n תרכובות תוך כדי שימוש במודל בו אותן התרכובת המסוימות לא נכללו. לאחר מכן מחושב ערך R2 על פי תחזיות אלה, אך מכונה בדרך כלל q2. בעוד R2 עולה ככל שמוסיפים משתנים בלתי תלויים, q2 בדרך כלל מגיע לערך מקסימאלי ומתחיל לרדת במהירות. אימות צולב חופשי-אחד-מאפשר מאפשר הערכת המודל להתאמת יתר, אך עדיין כוללת את כל הנתונים של התרכובות מקוריות. בפנים לעומת זאת, ערכת הבדיקות מייצגת הסרה לצמיתות של התרכובות הנבחרות לאימות המודל. כאשר קיימים נתונים בשפע, זאת בדרך כלל לא בעיה. עם זאת, מכיוון שרק 46 תרכובות היו זמינות במדריך לבחירת הממס של GSK, בחרנו לבצע אימות צולב חופשי.
2.4. דור מבנה
חיזוי ערכי המאפיינים של הפתרונות ההפוכים באמצעות QSPRs עוזר לצמצם את מספר המועמדים הפוטנציאליים. בנקודה זו המועמדים הפוטנציאליים הללו הם עדיין וקטורי פתרונות ולא ממש מבנים. בעוד שמתארים מולקולריים רבים זמינים ליצירת QSPRs, ישנם מעטים שקיימים ובלתי ניתנים להשלכה על מבנים בפועל. כדי לבצע שינוי זה אנו משתמשים באלגוריתם ספירת מבנים שפותח בעבר (Faulon et al., 2003). לשחזור הפיתרון, האלגוריתם מתחיל בתרשים המכיל רק אטומים ללא אג”ח. הקשרים מתווספים בכל האמצעים האפשריים כדי להרוות את הגרף התואם את חתימה מולקולרית היעד, אשר למעשה מהווה את סיכום כל החתימות האטומיות עבור פיתרון הפוך נתון. יתכן שפתרון הפוך יחיד יביא למספר מבנים. ככל שגובה החתימה מגביר את הניוון ישנם פחות מבנים שמתקבלים לפתרון.
טבלה-3
יש לשים לב כי בגבהים נמוכים יותר של חתימה, חתימה מולקולרית יכולה לייצר פתרונות איזומרים כשאיזומרים אלה הם זהים בחתימתם מולקולרית (בגובה זה). מכיוון שהחתימה המולקולרית של אותם איזומרים זהה, כל התכונות החזויות שלהם זהה אם משתמשים ב- QSPR עם חתימות אטומיות כמתאר מולקולרי. פירוט נוסף על אלגוריתם ספירת המבנה נמצא במקום אחר (Faulon, Brown, & Martin, 2005).
3. תוצאות
3.1. תרגום לחתימה
השלב הראשון בטכניקת העיצוב ההפוך היה לתרגם את מבני הדו-מימד מתבנית קובץ MOL לחתימה באמצעות המתרגם הביתי. בעבודה זו היו בתחילה 47 תרכובות במדריך לבחירת הממס של GSK. אתר נפט היה חייב להיות מוסר מהמחקר מכיוון שהוא היה מעבר להיקף הנוכחי בכדי להשיג חתימה מולקולרית לתערובת. 46 התרכובות הנותרות הביאו ל 36 חתימות אטומיות בגובה 1, מוצג בטבלה 3. סקריפט פרל השתמש ליצירת החתימה למסד נתונים ואז לזהות את המופעים של 36 חתימות אטומיות אלה, בכל אחד מתרכובות סט האימונים ליצירת המתאר.
3.2. QSPRs לבחירת ממס
השלב הבא היה ליצור חמישה QSPRs נפרדים עבור חמשת האזורים במדריך לבחירת הממס של GS ואשר יתנו רמה מספקת על מנת להשיג יכולת קורלציה/ניבוי. כמו שהזכרנו בעבר, המשמעות שנוצרה בפתרונות ההפוכים והמבנים המתאימים תהיה מועטה ללא היכולת לדרג אותם מול המתחמים ממערכת הניסויים. תוצאות ראשוניות הצביעו על כך שרגרסיה לינארית מרובה פשוטה לא תהיה מספקת בכדי לייצור QSPRs מועילים לכל חמשת האזורים הרצויים. בהתחשב במגבלה זו, היו שתי אפשרויות אפשריות: (1) להשתמש בחלופה (מחדש: לא ליניארית) טופס QSPR או (2) עבודה בגובה חתימה אטומית 2 כדי לכלול מידע נוסף. מכיוון שלרוב תרכובות סט הניסויים בעבודה זו יש משקל מולקולרי נמוך, מפאת הקושי בפתרון הבעיה ההפוכה בגובה 2 היא הייתה מגבילה את המגוון של המבנים ההפוכים שהתקבלו. הסבר נוסף בנושא זה, וכיצד הוא משפיע על התוצאות שהתקבלו, ניתן בסעיף 4 במאמר זה. לכן, החלטנו שכדי להעריך טופס QSPR שאינו ליניארי כדאי להמשיך לעבוד בגובה 1.
מטריצת התיאור המקורית שנוצרה הכילה 46 שורות שמתאימות לתרכובות במערך הניסויים ו -36 עמודות עם ערכי התרחשות עבור חתימות האטום הייחודיות. הרחבנו את מטריצת התיאור הזו ל 72 עמודות על ידי הכללת הריבוע מכל חתימה, אך מספר השורות נשאר בדיוק אותו דבר מכיוון שאף תרכובת לא הוסרה ולא נוספה למערך הניסויים. מקדם המתאם זוג-זוג בין כל אחד מ -72 התיאורים ממטריון התיאור הלא ליניארי חושבו כדי ליצור מטריצה של מתאם. כל התיאורים המתואמים לחלוטין (r> 0.999) הוסרו משיקולי יציבות (דרייפרוסמית ‘, 1998) וסך הכל נותרו 33 עם רגרסיה מרובה שניתן להמשיך איתם.
תרשים/איור
בחירת המודל הסופי בוצעה על ידי הערכת R2 ו- q2 כפונקציות למספר המשתנים העצמאיים הכלולים בכל שלב במהלך הרגרסיה. הייתכנות להשפעה על הסביבה QSPR ניתנת באיור 3. יש לשים לב שה- R2
גדל ככל שנוספים משתנים עצמאיים נוספים, אך q2 מתחיל להתדרדר לאחר כ -4 משתנים עצמאיים , לפני שירד בחדות לאחר עשרה משתנים עצמאיים. עבור זה רצינו להשתמש בכמה שיותר משתנים עצמאיים ב- QSPRs בכדי לכסות את מגוון החתימות הקיימות, עקב העובדה שמערך הניסויים הכיל מספר קבוצות של תרכובות. בהתאם לכך בחרנו ב- QSPR עם 9 משתנים עצמאיים מכיוון שזה הביא את ה- QSPR החזוי להכיל יותר מהמספר המרבי של המשתנים העצמאיים. הערכים החזויים לעומת שלו שנוסו כדי לבחון את ההשפעה הסופית QSPR נמצאים באיור 4. נקודות הנתונים באיור זה מופיעות בערימות עקב הנתונים הדיסקרטיים שנמצאו במדריך לבחירת הממס של GSK. התהליך לבחירת הדגם הסופי חזר על עצמו לאחר QSPRs, שבהם מסופקים מקדמי הסטטיסטיקה והרגרסיה בלוחות 4 ו -5 בהתאמה.
טבלה 4
איור 4
טבלה 5
3.3. עיצוב הפוך
לאחר יצירת כל 5 ה- QSPRs, העיצוב ההפוך של הפוטנציאל החדש של הממסים יכול להתחיל. תרשים זרימה המציג את זרימת העבודה עבור טכניקת העיצוב ההפוך הכוללת מובאת באיור 5. סך הכל 15 משוואות אילוץ נגזרו מ 36 בגובה הייחודי 1, חתימות אטומיות בטבלה 3, בהן 3 משוואות היו מודולריות ו-12 היו הומוגניות. ניתן לראות בכל 15 משוואות האילוץ בבפורמט המטריצה, כחלק ממידע משלים. שיטת האיטרציה של כוח ברוט שימשה כדי לפתור את מערכת משוואות האילוץ על בסיס ערכי המינימום והמקסימום של חתימות האטום במערך הניסויים. באמצעות גישה זו, סך של 4,031,916 פתרונות המספקים את כל משוואות האילוץ התקבלו אשר דרשו 62.572 שניות של זמן מעבד בלבד עלPentium 4 Xeon, מעבד 2.8 גיגה הרץ.
הפתרונות ההפוכים תוקנו בסדרת צעדים שקדמו ליצירת המבנים והראשון היה מבוסס על מולקולת משקל. ייתכן שהפתרונות ההפוכים היו משמעותיים יותר מכל התרכובות שנקבעו בניסויים בגלל מקסימום ערכי ההתרחשות שהיו קיימים בעת פתרון משוואות האילוץ. גבול עליון נקבע למשקל המולקולרי על 162 מכיוון שזה היה הערך הגדול ביותר שנצפה במערך האימונים. לכן, כל פתרון עם משקל מולקולרי גדול מ -162 הוסר
מהחשבון. החלת מגבלה זו צמצמה את המספר של הפתרונות הקיימים בכ 98% עד 99,240. לאחר מכן חושב מספר המחזורים ששימש בעבר כמרכיב בעיצוב ההפוך (Jackson et al., 2008; Weis et al., 2005). נשמרו רק פתרונות המכילים אפס או מחזור יחיד שעלה בקנה אחד עם המבנים במערך הניסויים (היה מקסימום מחזור אחד) אלו הביאו ל 64,995 פתרונות. סוף כל סוף, QSPRs שימשו כדי לקלוע לכמעט 65,000 הפתרונות שנותרו. כאן עבדו אנשי ה- QSPR כדי להימנע מהסיווג האדום הנמצא במדריך לבחירת הממס של GSK, וכך, רק הפתרונות ההפוכים עם התחזיות הגדולות או שוות ערך ל -4.0 מכל חמשת אנשי QSPR נשמרו. לאחר שלב זה, מספר הפתרונות ההפוכים הנותר היה 40,816.
איור GSK תרשים
מהניסיון שלנו, 40,000 פתרונות הפוכים הם עדיין מספר סביר של פתרונות בכדי להפוך בחזרה למבנים בפועל. אלגוריתם יצירת המבנה (Faulon et al., 2003) הוחל על 40,816 הפתרונות ההפוכים הללו והביא ל 69,033 מבנים דו מימדיים המאוחסנים בפורמט קובץ MOL. מכיוון שלא ניתן לבצע בחינת מספר כה גדול של מבנים, כוונון נוסף היה הכרחי. תוכנת Marvin Beans (MolConverter, 2007) שימשה לביצוע חישוב קואורדינטות תלת מימדיות על ידי אופטימיזציה עם שדה הכוח הנגדי. עבור כל מבנה שנוצר, מחושב ערך אנרגיה (kcal / mol) והדירוג בוצע על סמך ערך האנרגיה הנגדי המקסימלי מסט הניסויים. כל מבנה שאנרגיית הריידינג גדולה ממנו ב- 50 קק”ל , הושמט משיקולי יציבות וכך נותרו כ-40,660 מבנים.
3.4. מאגרי מידע ממוקדים של ממסים פוטנציאליים
40,660 המבנים מוינו למחלקות שונות כפי המוגדר במדריך לבחירת הממס של GSK, על מנת לארגן טוב יותר את מסד נתונים הממוקד. ברור שלא ניתן היה לבחון ולסווג ידנית את כל 40,000 המבנים. המשימה בוצעה עם כתיבת תסריט על ידי פרל בכדי לחפש חתימות אטומיות ספציפיות קיימות (או נעדרות) וכדי לזהות את הקבוצות הפונקציונליות השונות. לדוגמה, אלכוהולים חייבים להכיל חתימה אטומית של מימן המלוכד חמצן, [H] ([O]), אך לא יכולים היו להחזיק את חתימת האטום של החמצן שמקושר בכפילות לפחמן [O] ([C]), הנמצא בקטונים או אסטרים. דוגמאות מהמחלקות השונות בבסיס הנתונים הממוקד מובאות בטבלה 6, כולל תחזיות QSPR והתאמת מספרי CAS היכן שהם זמינים. מבנים אלה הם מייצגים את המגוון המבני המתקבל מפיתרון בעיה הפוכה ושונים מכל התרכובות שנמצאו במקור של סט הניסויים. התפלגות המבנים המתקבלים ניתנת בבפינה הימנית התחתונה של איור 5, אולם לא היו אלקנים או קטונים שנשארו בשלב סופי זה של האלגוריתם. ניתן היה להציב רק 1743 מתוך 40,660 המבנים בתוך השטח, שיעורים המוגדרים במדריך לבחירת הממס של GSK. מרבית המבנים בבסיס הנתונים הממוקד שלא עשו זאת, שייכים לאחת מהמחלקות שהוגדרו, והם נתפסים כיתרון באלגוריתם מסוים בכך שמבנים רבים שאינם אינטואיטיביים יכולים להיות מזוהים. כל מבנה שהכיל שתי מחלקות או יותר הוגדר כ”היברידי”. רק אותם המבנים ההיברידיים עם לפחות שלוש תחזיות QSPR ירוקות נשמרו, דבר שהפחית את 38,895 הכלאיים עד 3213 מבנים שניתנים לניהול. דוגמה למבנה היברידי ניתנת באיור 6, המבנה בתוך מרכז הנתון הזה הוא ההכלאה המכונה אתיל לקטט (CAS #97-64-3), ונבנה באמצעות האלגוריתם על ידי שילוב חתימות אטומיות משני תרכובות סט של ניסויים. כלומר, אתיל אצטט ו -2-פרופנול. סוג אחר של מתחם היה נוצר עם ערכי QSPR חזויים שוות ערך או עדיפים על סט המתחמים האחר. בנוסף ללקטט אתילי, דוגמאות של שמונה כלאיים אחרים ניתנים בטבלה 7. דוגמאות אלו נבחרו כדי להציג את מגוון התחזיות של ה- QSPR עבור ההיברידים מ-בסיס הנתונים הממוקד. לשלושת התרכובות הירוקות העליונות שלוש תחזיות, לשלושת המתחמים הבאים יש ארבע תחזיות QSPR בתחום הירוק, ושלושת האחרונים כוללים את כל תחזיות ה- QSPR הירוקות. קודי הצבע התקבלו על ידי ביצוע אותו פרוטוקול המדריך לבחירת ממס של GSK, למעט התחזיות שהיו חתוכות במקום שיעוגלו לערך המספר השלם הבא. נזכיר שלא היו תחזיות של QSPR שמקודדות באדום בגלל שהניקוד בוצע לפני יצירת המבנה שכבר הוסר.
תרשים 6
טבלה 6
דיון
בשלב מוקדם של טכניקת העיצוב ההפוך, יש לקחת בחשבון שאלה חשובה: מה גובה החתימה המתאים שאיתו יש לעבוד? אין תשובה נכונה או לא נכונה, אלא חילופי דברים להערכה בין שני נושאים: (א) מתארי QSPR זמינים ו- (ב) סוגים של תרכובות שנמצאות בבסיס הנתונים הממוקד. חייבת להיות רמה מספקת של מידע מבנית מקודדת בחתימה אטומית ליצירת QSPR שימושי, אך מעבר לגובה 1 זה יכול להיות בעייתי. גובה 1 הוא המפלס הנמוך ביותר כדי לפתור את הבעיה ההפוכה מכיוון שלא קיימים חיבורים רוויים במהלך יצירת המבנים עם החתימות האטומיות בגובה 0. ככל שגובה החתימה גדל מ -1 ל -2, האילוץ של המשוואות הופך מורכב ומאתגר יותר לפתרון עקב המספר ההולך וגדל של חתימות אטומיות ייחודיות. בנוסף, המגוון של המבנים בבסיס הנתונים הממוקד יהיה מוגבל מכיוון שמידע ספציפי למערך האימונים המקורי היה מקודד. לדוגמה, המבנה של אתיל לקטט מאיור 6. על ידי פתרון הבעיה ההפוכה בגובה 1 ניתן היה לעשות בשלב את קבוצות האצטט והאלכוהול מחתימות אטומיות נפרדות ליצירת לקטט. עם זאת, לשחזור אתיל לקטט בעבודה בגובה 2 נדרשת החתימה אטומית הבאה: [C] ([C] ([O] [O]) [C] ([H] [H] [H]) [H] [O] ([H])). גם האצטט וגם רכיבי אלכוהול מקודדים בחתימה זו בו זמנית על ידי הרחבת קשר נוסף לגובה 2. מכיוון שלא היו לקטטים במערך האימונים המקורי, חתימה אטומית זו לא היוותה חלק ממאגר חתימות האטום. לכן, זה יהיה בלתי אפשרי לגלות מבנה לקטטי כלשהו על ידי פתרון היפוך הבעיה בגובה 2. מסיבה זו בחרנו לפתור את היפוך הבעיה בגובה 1, ולאפשר הכללה של מועמדים פוטנציאליים יותר שאינם אינטואיטיביים. כמובן שיש לחזור על פיתרון הבעיות בגובה 1 שמביא להרבה יותר מבנים שנוצרו מהפתרונות ההפוכים (מכיוון שהניוון הוא הפוך פרופורציונלית לגובה חתימה (Faulon et al., 2003).
שוב, יש ליצור איזון וישנם מצבים מסוימים שבהם פתרון בעיה בגובה 2 רצוי יותר מגובה 1 (ג’קסוןואח ‘, 2008).
טבלה 7
אתיל לקטט הוא מבנה שנמשך מהמאגר הממוקד מכיוון שמדובר בהכלאה המשלבת חתימות אטומיות מההניסויים שנקבעו בדרך אחרת והיוו תחזיות חיוביות של QSPR. ההשפעות על הסביבה, הבריאות והבטיחות היו מקודדים בתחזיות כירוקים, ואילו הפסולת הסביבתית וה- LCA היו צהובים. לתחזיות אלה יש תועלת מוגבלת מבלי להכיר את ה- QSPRs התקפים. ניתן היה ליצור QSPRs סבירים באמצעות הטופס הלא-לינארי בארבעה מתוך חמשת האזורים בלוח 4. ערך ה- q2 עבור ה- LCA היה נמוך משמעותית מכל התחומים האחרים, מה שמעיד שהוא חסר יכולת חיזוי חזקה. עם זאת, ה- LCA QSPR עדיין יכול להיות שימושי אם מתייחסים אליו כאל כלי ניקוד גס. נקבע כי מערך האימונים כלל מגוון של שיעורי ממס של-QSPR שלהם היו יכולות ניבוי מתונות. כאמור, המבנים הממוקדים בבסיס הנתונים המסווגים כהיברידיים אינם שייכים לאף אחד מהשיעורים מתוך מדריך הבחירה בממסים של GSK. בהתאם, תמיד יש את חשש מפני אקסטרפולציה כששוקלים את השימוש ב- QSPR מחוץ לשיעורים עליהם הוכשרו, גם אם הם שילובי שיעורים (כמו הכלאה). לגבי אתיל לקטט, ישנם מספר אזכורים המתעדים יישומים כממס ידידותי לסביבה בכדי לספק עדויות תומכות לתחזיות QSPR שלנו. ניקלס, פיאו, ליין ו-ניקלס (2001) החליפו את MEK, MIBK וטולואן המשמשים במגנטיות ציפוי קלטת עם אתיל לקטט כי זה היה פחות מזיק, פחות מזהם אוויר ויכול להיות מיוצר מחומרים מתחדשים. חברת ארצ’ר-דניאלס-מידלנד (עבאס, רמלסברג,& Beery, 2003) הגישה כפטנט אתיל לקטט כממיס ירוק לתמצית פיטוסטרולים מסיבי תירס רטובים, המספקים למוצר שמן פיטוסטרולים חופשיים וחומצות שומן חופשיות. וירסק ביו-ממסים (Datta, 2003) הגישה פטנט להחלת אתיל לקטט כמרכיב בממיס ידידותי לסביבה בעל ריח נמוך לנקיון מכונות. אישידה וצ’פמן (2009) זיהו לאחרונה אתיל לקטט כתחליף לממסים רעילים על בסיס נפט למיצוי קרוטנואיד. התגלה כי אתיל לקטט מאבקת עגבניות מיובשת היה ממס יעיל הן לאיזומרים של ציס והן לטרנס ליקופן. אתיל לקטט זה גם היה מסוגל לחלץ לוטאין וקרוטן מאבקה מיובשת שמקורם בתירס לבן וגזרים. בנוסף לאתיל לקטט, התרכובת הרביעית בטבלה 7, איזואמיל לקטט
(CAS # 19329-89-6), נרשמה כפטנט על ידי חברת ארצ’ר-דניאל-מידלנד (Muse, 2007) כממס ניקוי מתכלה ידידותי לסביבה. המבנה דומה לאתיל לקטט, אבל ישנו חיזוי פסולת סביבתית משופר. כמו כן, התרכובת החמישית בטבלה 7, חומצה לקטית (CAS # 50-21-5), נבדקה לאחרונה על ידי דאטה והנרי (2006) שדיווחו כי הייצור עלה לכ -120,000 ט”ר -1. רובה של החומצה לקטית בארצות הברית משמש למטרות הקשורות למזון. עם זאת, צפוי כי היישום בה כחומר ממס ירוק יגדל בעתיד. פליוגו (2005) השתמש באב initio חישובים כדי לחזות שהתרכובת השישית בטבלה 7, 1,4benzenedimethanol (CAS # 589-29-7), כאשר היא מעורבת עם DMSO יכול לייצר ממס חדש המסוגל להגביר את תגובת ה- SN2 עד גורם של 103 לעומת DMSO בלבד. אותו הדבר גם אצל הו, ווין וניסן (1993) שהשתמשו במתחם גם בתור מאריך שרשרת לתגובה פולימרית. לא היה אזכור כלשהו לשיקולים סביבתיים עבור 1,-benzenedimethanol בכל אחד ממאמריהם, אך על פי ה- MSDS של Sigma – Aldrich (2009) לא היה ידוע על סכנות OSHA וזיהוי חומרים כמסוכנים ובסיווג המערכת (HMIS) הם צויינו כאפס בסכנה בריאותית, דליקות ומפגע גופני. יש לשים לב כי סיווג HMIS של אפס מעיד על סכנה מינימלית. המבנים ההיברידיים מהמאגר הממוקד נדונו לעיל מלהיבים, מכיוון שיש פוטנציאל לפתח קישור בין מחלקות הממס. עם זאת, ישנם היבטים ייחודיים לגבי הדגימות מלוח 6 שהם חלק מהמחלקות המוגדרות בממס במדריך לבחירה של GSK. שני האלכוהולים מספקים את כל תחזיות ה- QSPR הירוקות ו- CAS # 860379-09-5 כולל ציקלופנטן המכיל מבנה שאינו קיים באף אחד מהאלכוהולים ממערכת הניסויים. למדגמים ישנן תחזיות QSPR דומות לאלו שנמצאו בסט ההדרכה, אם כי ההבדלים כוללים את הקבוצה התפקודית כחלק מהטבעת של חמישה מרכיבים (CAS # 1636-45-9), וסיקלוהקסאן נפרד (CAS # 4630-82-4). הרחבת שרשראות האלקיל מסט הניסויים מוביל דימתיל פורממיד המורכב במבנה היחיד בטבלה 6 ללא CAS #. המבנה שהשתנה משפר את דירוג הפסולת הסביבתית מצהוב לירוק, הופך את דירוג הבריאות מהאדום הלא רצוי לצהוב מקובל ושומר על דירוג הצבע עבור האזורים האחרים.
5. מסקנה
טכניקת העיצוב ההפוך עם מולקולרית חתימה המתאר הוחלה על הנתונים הכמותיים למחצה של מדריך ה-GSK לבחירת ממס. מטרת עבודה זו הייתה להציע ממסים פוטנציאליים נוספים שצפויים להשפיע לטובה על ידי דירוגים עבור פסולת סביבתית, השפעה על הסביבה, בריאות, בטיחות, ו- LCA. לא הייתה בכוונתנו לספק את הממס הסופי למטרה מסוימת, אלא להחיל את ה- CAMD באמצעות חתימת המתאר מולקולרי כהמלצה על מגוון ממסים ירוקים פוטנציאליים שניתן להעריך בהמשך על ידי מומחים ו/או ניסויים. מאגרי מידע ממוקדים של מבנים מתקבל לאלכוהולים, אסטרים, חומצות, משמשים קוטביים, בסיסים ואתר שהכיל תרכובות מעבר למערך הניסויים המקורי. יכולת טכניקת העיצוב ההפוך לייצר ביעילות מבנים ללא דרישת התבנית של CAMD הביאה למסד נתונים ממוקד נוסף שהוגדר כבן כלאיים, שהכיל לפחות שני שיעורים מסט הניסויים המקורי. כדוגמא ליעילות הפוטנציאלית של ההיפוך הוכחה טכניקת התכנון באמצעות מציאת אתיל לקטט בחלק ממסדי הנתונים ההיברידיים הממוקדים.
גילוי מחדש של ממס ירוק מספק מוטיבציה להערכה נוספת של הקשרים בין המבנים שזוהו במחקר זה.
מחקר זה מומן על ידי פרס מדען ומהנדס הנשיא של המחלקה לאנרגיה לשנת 2004. חישובי העבודות בוצעו במעבדה להנדסה בסיוע מחשבים בקמפוס האוניברסיטה הטכנולוגית טנסי.
תכנון מולקולרי ממוחשב באמצעות חתימת מתאר מולקולרי - יישום לבחירת ממס
מאת: דרק סי. וייס ו דונאלד פי. ויסקו
המחלקה להנדסה כימית, האוניברסיטה הטכנולוגית טנסי, Box 5013, קוקוויל, TN 38505, ארצות הברית
תקציר:
ישנו ביקוש הולך וגדל לפתח ממסים ידידותיים יותר לסביבה על מנת להפחית עלויות וכדי לעמוד בדרישות הרגולציה. חוקרים ב- GlaxoSmithKline ) GSK) פיתחו מדריך לבחירת ממס המדרג 47 ממיסים בשימוש נפוץ בין 1 ל 10, בחמישה תחומים הקשורים לתאימות סביבתית. בעבודה זו, אנו מיישמים תכנון מולקולרי ממוחשב המכונה עיצוב הפוך בחתימת מתאר עם חתימה מולקולרית לזיהוי ממסים ירוקים נוספים, שעלולים להיות מחוץ לרשימת ה-GSK. עם יישום זה, הגישה הרבה יותר מהירה, פחות יקרה ומאפשרת חיפוש מקיף יותר אחר מועמדים מתאימים מאשר לעבוד עם נתונים מניסויים בלבד. אנו מציגים את התוצאות של הממסים עם התכונות החזויות האופטימליות מבין 47 התרכובות במדריך ה-GSK הכולל כמה סוגי כלאיים מוצלבים. בנוסף, הטכניקה שלנו "מגלה מחדש" את הממס הירוק המומלץ באמצעות שיטה זו על ידי שילוב של סוגי ממס שונים.
1. הקדמה
באופן כללי, ממס הוא חומר מומס (מוצק,נוזל או גז) ליצירת תמיסה. יש לייצר ממיסים טובים שישמשו במהלך חיי היומיום. הממס הנפוץ ביותר הוא מים. דוגמאות נפוצות נוספות בהן נדרשים ממסים כוללות ניקוי יבש, שומנים, שומנים, דבקים וטקסטיל (Gani et al.,
2006). ממסים ממלאים שנים רבות תפקיד חשוב בתהליכים כימיים ובתעשיות תרופות , עם זאת, הולכת וגוברת הדרישה למזער את השימוש בממסים מסוימים או להחליף אותם בשל הוצאות גבוהות. הוצאות אלה יכולות להיות מסיבת בעיות בריאות ובטיחות (EHS) הקשורות לרעילות או פינוי פסולת (Curzons, Constable, & Cunningham, 1999). לדוגמה, אם לא ניתן לבצע מיחזור ממס, שריפה של החומר תיתכן ותיהיה מלווה בעלויות נוספות בגלל מחירי אנרגיה גבוהים. השימוש בממיס חלופי יכול להוות חלופה.
לפיתוח מוצרים, מהנדסים כימיים חייבים לקחת בחשבון סוגיות אלה ולעשות את הבחירה הטובה ביותר האפשרית. על מנת לעזור לכימאים ומהנדסים לבחור ביתר קלות, החוקרים ב-GSK פיתחו מדריך לבחירת ממס (Curzons et al., 1999). המדריך משמש כמקור תמציתי של מידע על 35 ממסים נפוצים, ונועד להוסיף את הנהלים הקיימים הכרוכים במהלך בחירת הממס בתחילת תהליך הפיתוח. המדריך מאפשר לקחת בחשבון את מגוון מאפייני הממס, חששות טכניים ועלויות סטנדרטייות. תשע הקטגוריות הבאות נחשבות כחשובות ומופיעות במדריך: שריפה, מיחזור, טיפול ביולוגי, פחמן אורגני נדיף, השפעת...
295.00 ₪
295.00 ₪