סוכן דפדפן (Browser Agent)

סוכן הדפדפן הוא מרכיב מרכזי בשלדת העבודה Q-ACE, המספק אוטומציית אינטרנט מתקדמת מבוססת בינה מלאכותית. הוא רותם את ספריית browser-use כדי לתרגם משימות בשפה טבעית לפעולות דפדפן מדויקות.

🚀 יכולות עיקריות

שליטה בשפה טבעית: תאר משימות כמו "מצא את המחיר הנמוך ביותר למסך 4K באמזון" או "התחבר לפורטל הבדיקות ואמת את הדוח האחרון".
משוב ויזואלי בזמן אמת: צפה בסוכן עובד דרך זרם SSE (Server-Sent Events) חי, המציג כל שלב ומעבר בין כתובות URL.
קבלת החלטות חכמה: מופעל על ידי מודלי LLM מתקדמים המבינים מבני DOM ואלמנטים אינטראקטיביים.
תמיכה במולטי-מודאליות: משתמש בראייה (צילומי מסך) כדי לנווט בממשקי משתמש מורכבים שבהם ניתוח טקסט לבדו עלול להיכשל.
התאוששות חזקה מכשלים: מנסה שוב באופן אוטומטי פעולות שנכשלו ומתאים אסטרטגיות כאשר הוא נתקל בפריסות דף לא צפויות.

🛠 ️ טכנולוגיות

ספרייה: browser-use גרסה 0.12 ומעלה.
מנוע: Playwright (דרך browser-use).
סביבת הרצה: סביבת .venv מבודדת המשתמשת במנהל החבילות uv לביצועים גבוהים.
ממשק: FastAPI SSE להזרמת עדכונים לפרונטנד מודרני מבוסס Alpine.js.

🤖 ספקי LLM נתמכים

סוכן הדפדפן תומך במגוון רחב של ספקי LLM:

Google Gemini: מותאם ליעילות ומהירות (למשל, gemini-2.5-flash).
Ollama: הרצת אוטומציה ממוקדת פרטיות באופן מקומי (מומלץ gemma3:1b ומעלה).
OpenAI: תמיכה ב-o3, gpt-4o וכו'.
Anthropic: חשיבה בדיוק גבוה עם claude-3-5-sonnet.
DeepSeek: מודלים ייעודיים לתכנות וחשיבה.
Azure/AWS Bedrock: אינטגרציות ענן ברמת ארגון.

⚙ ️ הגדרות והתאמה אישית

הסוכן ניתן להגדרה מקיפה דרך טאבים של הגדרות דפדפן (Browser Settings) והגדרות סוכן (Agent Settings):

הגדרות דפדפן

מצב Headless: הרצה שקטה ברקע או צפייה בחלון במצב "headful".
הקלטה ומעקב: הפעל הקלטת וידאו (דורש ffmpeg) ומעקב Playwright לניפוי שגיאות.
אמולציית מכשירים: הגדר גדלי חלון/תצוגה מותאמים אישית ו-User-Agents.
הגבלות דומיין: הגדר דומיינים מותרים (allowed_domains) או אסורים לטובת בטיחות.

הגדרות סוכן

מצב חשיבה (Thinking Mode): מאפשר לסוכן לעצור ו"לחשוב" לפני ביצוע פעולה.
מצב Flash: ביצוע מהיר למשימות פשוטות במהירות גבוהה.
מקסימום צעדים/פעולות: שליטה בעומק הביצוע למניעת לולאות אינסופיות או שימוש מופרז בטוקנים.
בטיחות: סינון נתונים רגישים מובנה להגנה על אישורי גישה ומידע פרטי.

📊 היסטוריה ואנליטיקה

כל הרצה מתועדת ומאוחסנת במסד הנתונים המקומי data/auth.db:

שחזור צעד-אחר-צעד: צפייה בהיסטוריית הפעולות, המחשבות והנתונים שנשלפו.
ניתוח מבוסס AI: לאחר הרצה, השתמש בתכונת ה-"Analyze" לקבלת ניתוח סיבת שורש (RCA) מקצועי ודוח ביצועים המופק על ידי LLM.
לוח בקרה לסטטיסטיקה: מעקב אחר שיעורי הצלחה ומגמות יומיות בכל חבילת האוטומציה שלך.

🚀 מודל ביצוע

הסוכן רץ בתת-תהליך (subprocess) ייעודי (handlers/browser_agent_runner.py). זה מבטיח ש:

שרת ה-FastAPI הראשי נשאר זמין.
לסוכן יש מאגר משאבים משלו.
שגיאות באוטומציה לא מפילות את כל השלדה.
ניקוי וניהול תהליכים חזק גם ב-Windows וגם ב-Linux.

נבנה ב-❤️ על ידי עתיד האוטומציה

תיעוד