Switch to English

תיעוד

כל מה שצריך לדעת על ה-Q-Ace Agentic Framework.

 סוכן דפדפן (Browser Agent)

סוכן הדפדפן הוא מרכיב מרכזי בשלדת העבודה Q-ACE, המספק אוטומציית אינטרנט מתקדמת מבוססת בינה מלאכותית. הוא רותם את ספריית browser-use כדי לתרגם משימות בשפה טבעית לפעולות דפדפן מדויקות.

🚀 יכולות עיקריות

  • שליטה בשפה טבעית: תאר משימות כמו "מצא את המחיר הנמוך ביותר למסך 4K באמזון" או "התחבר לפורטל הבדיקות ואמת את הדוח האחרון".
  • משוב ויזואלי בזמן אמת: צפה בסוכן עובד דרך זרם SSE (Server-Sent Events) חי, המציג כל שלב ומעבר בין כתובות URL.
  • קבלת החלטות חכמה: מופעל על ידי מודלי LLM מתקדמים המבינים מבני DOM ואלמנטים אינטראקטיביים.
  • תמיכה במולטי-מודאליות: משתמש בראייה (צילומי מסך) כדי לנווט בממשקי משתמש מורכבים שבהם ניתוח טקסט לבדו עלול להיכשל.
  • התאוששות חזקה מכשלים: מנסה שוב באופן אוטומטי פעולות שנכשלו ומתאים אסטרטגיות כאשר הוא נתקל בפריסות דף לא צפויות.

🛠 ️ טכנולוגיות

  • ספרייה: browser-use גרסה 0.12 ומעלה.
  • מנוע: Playwright (דרך browser-use).
  • סביבת הרצה: סביבת .venv מבודדת המשתמשת במנהל החבילות uv לביצועים גבוהים.
  • ממשק: FastAPI SSE להזרמת עדכונים לפרונטנד מודרני מבוסס Alpine.js.

🤖 ספקי LLM נתמכים

סוכן הדפדפן תומך במגוון רחב של ספקי LLM:

  • Google Gemini: מותאם ליעילות ומהירות (למשל, gemini-2.5-flash).
  • Ollama: הרצת אוטומציה ממוקדת פרטיות באופן מקומי (מומלץ gemma3:1b ומעלה).
  • OpenAI: תמיכה ב-o3, gpt-4o וכו'.
  • Anthropic: חשיבה בדיוק גבוה עם claude-3-5-sonnet.
  • DeepSeek: מודלים ייעודיים לתכנות וחשיבה.
  • Azure/AWS Bedrock: אינטגרציות ענן ברמת ארגון.

 ️ הגדרות והתאמה אישית

הסוכן ניתן להגדרה מקיפה דרך טאבים של הגדרות דפדפן (Browser Settings) והגדרות סוכן (Agent Settings):

הגדרות דפדפן

  • מצב Headless: הרצה שקטה ברקע או צפייה בחלון במצב "headful".
  • הקלטה ומעקב: הפעל הקלטת וידאו (דורש ffmpeg) ומעקב Playwright לניפוי שגיאות.
  • אמולציית מכשירים: הגדר גדלי חלון/תצוגה מותאמים אישית ו-User-Agents.
  • הגבלות דומיין: הגדר דומיינים מותרים (allowed_domains) או אסורים לטובת בטיחות.

הגדרות סוכן

  • מצב חשיבה (Thinking Mode): מאפשר לסוכן לעצור ו"לחשוב" לפני ביצוע פעולה.
  • מצב Flash: ביצוע מהיר למשימות פשוטות במהירות גבוהה.
  • מקסימום צעדים/פעולות: שליטה בעומק הביצוע למניעת לולאות אינסופיות או שימוש מופרז בטוקנים.
  • בטיחות: סינון נתונים רגישים מובנה להגנה על אישורי גישה ומידע פרטי.

📊 היסטוריה ואנליטיקה

כל הרצה מתועדת ומאוחסנת במסד הנתונים המקומי data/auth.db:

  • שחזור צעד-אחר-צעד: צפייה בהיסטוריית הפעולות, המחשבות והנתונים שנשלפו.
  • ניתוח מבוסס AI: לאחר הרצה, השתמש בתכונת ה-"Analyze" לקבלת ניתוח סיבת שורש (RCA) מקצועי ודוח ביצועים המופק על ידי LLM.
  • לוח בקרה לסטטיסטיקה: מעקב אחר שיעורי הצלחה ומגמות יומיות בכל חבילת האוטומציה שלך.

🚀 מודל ביצוע

הסוכן רץ בתת-תהליך (subprocess) ייעודי (handlers/browser_agent_runner.py). זה מבטיח ש:

  1. שרת ה-FastAPI הראשי נשאר זמין.
  2. לסוכן יש מאגר משאבים משלו.
  3. שגיאות באוטומציה לא מפילות את כל השלדה.
  4. ניקוי וניהול תהליכים חזק גם ב-Windows וגם ב-Linux.

נבנה ב-❤️ על ידי עתיד האוטומציה

האם דף זה היה מועיל?