כך ניתן לחלץ טקסט בעזרת Spectacle, כלי צילום המסך של KDE

  • ספקטקל יכול לחלץ טקסט מפלאזמה 6.6, אך לא כברירת מחדל.
  • יש להתקין חבילות Tesseract OCR.

חילוץ טקסט באמצעות Spectacle

מאז פברואר האחרון, במקביל להשקת פלזמה 6.6, הצג זה יכול לחלץ טקסט מצילומי מסך. תכונה זו ידועה בשם זיהוי תווים אופטי, או OCR. עם זאת, היא אינה מופעלת כברירת מחדל, וייתכן שתתהו מדוע אינכם רואים את האפשרות גם לאחר עדכון לגרסה העדכנית ביותר, שהיא כרגע Plasma 6.6.5.

הסיבה פשוטה: החבילות הדרושות חסרות. זה קורה גם עם האפשרות לסרוק קוד QR כדי לגשת לרשת Wi-Fi, אבל זה נושא למאמר אחר. כאן נסביר. כיצד להפעיל תמיכה ב-OCR ב-Spectacle, כל עוד אתה משתמש ב-Plasma 6.6 ומעלה.

הפעל תמיכה ב-OCR ב-Spectacle אם אתה משתמש ב-Plasma 6.6 או גרסה מתקדמת יותר.

כאשר אנו מצלמים צילום מסך לאחר העדכון, אנו רואים שהאפשרות לחלץ טקסט אינה מופיעה, בניגוד למה שמוזכר בהוראות. מכתבי שחרוריש אפילו סרטון לדוגמה:

אם נפתח את Spectacle ונעבור להגדרות שלו, נראה שבקטע ה-OCR יש סמל עם "i" שנותן לנו מידע נוסף. ובכן, זה פשוט אומר לנו שהוא לא זמין.

זיהוי תווים אופטי (OCR) אינו זמין

ספקטקל מסוגל לחלץ טקסט באמצעות הממשק שלו, אבל הקסם נעשה על ידי... Tesseract OCRזה נפוץ בתוכנות המשמשות מערכות מבוססות לינוקס: תוכנות רבות הן ממשקאבל הם תלויים במשהו Backend תנו לו לעשות את העבודה.

כדי להעלים את ההודעה בצילום המסך הקודם ולהחליפה באפשרויות OCR, עלינו להתקין את חבילות Tesseract הדרושות. במקרה שלי, עם הפצה מבוססת Arch כמו Manjaro, החבילות הנדרשות הן:

  • טסראקט
  • tesseract-data-osd
  • tesseract-data-cat
  • tesseract-data-eng
  • tesseract-data-spa

חבילות טסרקט

מבין החבילות לעיל, אלו שמסתיימות ב- -cat, -eng ו- -spa הן השפות שאני רוצה שהיא תזהה (קטלאנית, מכיוון שאני ממזרח ספרד, אנגלית וספרדית). טסראקט זוהי החבילה הראשית, והסיומת -osd מאפשרת לתוכנה לזהות את כיוון הכתיבה, מה שבתיאוריה, יאפשר לה לזהות טקסט גם אם הוא מסובב ב-90 מעלות, למשל.

זה ברור, אבל שווה לחזור על זה: אם מישהו צריך עוד שפות, הוא רק צריך להתקין את החבילות עבורן. לדוגמה, הסיומת -ita באיטלקית, -fra בצרפתית, או -rus ברוסית.

התקנה של מה שצריך

ההתקנה בהפצות שונות תהיה תלויה בהפצה הספציפית. במקרה של Manjaro, ניתן לעשות זאת באמצעות Pamac (כלי ניהול החבילות הגרפי שלה), אך גם באמצעות sudo pacman -S tesseract tesseract-data-osd tesseract-data-cat tesseract-data-eng tesseract-data-spaבהפצות אחרות, כגון אלו המבוססות על דביאן או openSUSE, החבילה עשויה להיות tesseract-ocr.

לאחר התקנת החבילות, תראו אפשרות לצלם צילום מסך, כפי שמוצג בתמונה המסך של הכותרת ובסרטון ההדרכה של KDE. לחיצה על "חילוץ טקסט" תציג הודעה המאפשרת לכם להעתיק את הטקסט ללוח או לפתוח אותו בעורך טקסט.

הערה: עליך להפעיל את השפות מההגדרות

כאשר האפשרות הופכת לזמינה, גם ההגדרות משתנות. ההודעה המציינת שהיא אינה זמינה מוחלפת בסעיף "זיהוי טקסט (OCR)". סעיף זה מורכב משני חלקים בלבד:

  • בחירת שפה: באמצעות תיבות סימון. נבחר את השפות שמהן נרצה לחלץ טקסט. זוהי גם דרך טובה לראות אילו שפות התקנו ואילו מהן נתמכות.
  • סגירה לאחר חילוץ מונעת שמירה אוטומטית. זה עניין של העדפה אישית, אבל אני לא מסומן. זה מבטיח שזה תמיד מועתק ללוח.

זהו תהליך פשוט, אך הוא אינו מופעל כברירת מחדל. על ידי התקנת מספר חבילות, Spectacle יוכל "לקרוא".