סוכן דפדפן (Browser Agent)
סוכן הדפדפן הוא מרכיב מרכזי בשלדת העבודה Q-ACE, המספק אוטומציית אינטרנט מתקדמת מבוססת בינה מלאכותית. הוא רותם את ספריית browser-use כדי לתרגם משימות בשפה טבעית לפעולות דפדפן מדויקות.
🚀 יכולות עיקריות
- שליטה בשפה טבעית: תאר משימות כמו "מצא את המחיר הנמוך ביותר למסך 4K באמזון" או "התחבר לפורטל הבדיקות ואמת את הדוח האחרון".
- משוב ויזואלי בזמן אמת: צפה בסוכן עובד דרך זרם SSE (Server-Sent Events) חי, המציג כל שלב ומעבר בין כתובות URL.
- קבלת החלטות חכמה: מופעל על ידי מודלי LLM מתקדמים המבינים מבני DOM ואלמנטים אינטראקטיביים.
- תמיכה במולטי-מודאליות: משתמש בראייה (צילומי מסך) כדי לנווט בממשקי משתמש מורכבים שבהם ניתוח טקסט לבדו עלול להיכשל.
- התאוששות חזקה מכשלים: מנסה שוב באופן אוטומטי פעולות שנכשלו ומתאים אסטרטגיות כאשר הוא נתקל בפריסות דף לא צפויות.
🛠 ️ טכנולוגיות
- ספרייה:
browser-useגרסה 0.12 ומעלה. - מנוע: Playwright (דרך browser-use).
- סביבת הרצה: סביבת
.venvמבודדת המשתמשת במנהל החבילותuvלביצועים גבוהים. - ממשק: FastAPI SSE להזרמת עדכונים לפרונטנד מודרני מבוסס Alpine.js.
🤖 ספקי LLM נתמכים
סוכן הדפדפן תומך במגוון רחב של ספקי LLM:
- Google Gemini: מותאם ליעילות ומהירות (למשל,
gemini-2.5-flash). - Ollama: הרצת אוטומציה ממוקדת פרטיות באופן מקומי (מומלץ
gemma3:1bומעלה). - OpenAI: תמיכה ב-
o3,gpt-4oוכו'. - Anthropic: חשיבה בדיוק גבוה עם
claude-3-5-sonnet. - DeepSeek: מודלים ייעודיים לתכנות וחשיבה.
- Azure/AWS Bedrock: אינטגרציות ענן ברמת ארגון.
⚙ ️ הגדרות והתאמה אישית
הסוכן ניתן להגדרה מקיפה דרך טאבים של הגדרות דפדפן (Browser Settings) והגדרות סוכן (Agent Settings):
הגדרות דפדפן
- מצב Headless: הרצה שקטה ברקע או צפייה בחלון במצב "headful".
- הקלטה ומעקב: הפעל הקלטת וידאו (דורש
ffmpeg) ומעקב Playwright לניפוי שגיאות. - אמולציית מכשירים: הגדר גדלי חלון/תצוגה מותאמים אישית ו-User-Agents.
- הגבלות דומיין: הגדר דומיינים מותרים (
allowed_domains) או אסורים לטובת בטיחות.
הגדרות סוכן
- מצב חשיבה (Thinking Mode): מאפשר לסוכן לעצור ו"לחשוב" לפני ביצוע פעולה.
- מצב Flash: ביצוע מהיר למשימות פשוטות במהירות גבוהה.
- מקסימום צעדים/פעולות: שליטה בעומק הביצוע למניעת לולאות אינסופיות או שימוש מופרז בטוקנים.
- בטיחות: סינון נתונים רגישים מובנה להגנה על אישורי גישה ומידע פרטי.
📊 היסטוריה ואנליטיקה
כל הרצה מתועדת ומאוחסנת במסד הנתונים המקומי data/auth.db:
- שחזור צעד-אחר-צעד: צפייה בהיסטוריית הפעולות, המחשבות והנתונים שנשלפו.
- ניתוח מבוסס AI: לאחר הרצה, השתמש בתכונת ה-"Analyze" לקבלת ניתוח סיבת שורש (RCA) מקצועי ודוח ביצועים המופק על ידי LLM.
- לוח בקרה לסטטיסטיקה: מעקב אחר שיעורי הצלחה ומגמות יומיות בכל חבילת האוטומציה שלך.
🚀 מודל ביצוע
הסוכן רץ בתת-תהליך (subprocess) ייעודי (handlers/browser_agent_runner.py). זה מבטיח ש:
- שרת ה-FastAPI הראשי נשאר זמין.
- לסוכן יש מאגר משאבים משלו.
- שגיאות באוטומציה לא מפילות את כל השלדה.
- ניקוי וניהול תהליכים חזק גם ב-Windows וגם ב-Linux.
נבנה ב-❤️ על ידי עתיד האוטומציה