OCR eylemleri
Power Automate, kullanıcıların optik karakter tanıma (OCR) üzerinden dosyalardaki verileri okumasına, ayıklamasına ve yönetmesine olanak tanır.
OCR altyapısı oluşturmak ve görüntülerden ve belgelerden metin ayıklamak için Metni OCR ile Ayıkla eylemini kullanın. Aşağıdaki örnekte, belirtilen görüntünün tümünden metin ayıklanmaktadır.
Tüm OCR eylemleri, yeni bir OCR altyapısı değişkeni oluşturabilir veya mevcut bir değişkeni kullanabilir. OCR yetenekleri sunan eylemlerde mevcut OCR altyapısı değişkenlerini kullanabilirsiniz.
Power Automate, Windows OCR ve Tesseract altyapılarını destekler. Seçili OCR altyapısını yapılandırmak için uygun eylemin OCR altyapısı ayarları'na gidin. Mevcut seçenekler arasında dil ile görüntü genişliği ve yüksekliği çarpanları vardır.
Not
- Tüm mevcut OCR altyapıları, Power Automate'te önceden yüklenmiştir ve buluta bağlanmadan yerel olarak çalışır. Ancak belirli dillerdeki metinleri ayıklamak için dil paketleri veya veri dosyaları indirmeniz gerekebilir.
- Görüntü çeşitlileri, aramanın ve metin ayıklamanın daha etkili olması için resim boyutunu artırır. Üçten büyük değerler ayarlamak hatalı sonuçlara yol açabilir.
Windows OCR altyapısını kullanma
Power Automate'teki varsayılan OCR altyapısı, Windows OCR altyapısıdır. Windows OCR altyapısını kullanarak metinleri ayıklamak için ayıklamak istediğiniz dile uygun dil paketini yüklemeniz gerekir.
Uygun dil paketi yüklü değilse Power Automate, dil paketini yüklemenizi isteyen bir hata döndürür. Dil paketlerini indirme ve yükleme hakkında daha fazla bilgi için Windows için dil paketleri bölümüne gidin.
Uygun dil paketini yükledikten sonra OCR eyleminin OCR altyapısı ayarları'nı genişletin ve istediğiniz dili seçin. Windows OCR altyapısı; Çince (Basitleştirilmiş ve Geleneksel), Çekçe, Danca, Felemenkçe, İngilizce, Fince, Fransızca, Almanca, Yunanca, Macarca, İtalyanca, Japonca, Korece, Norveççe, Lehçe, Portekizce, Rumence, Rusça, Sırpça (Kiril ve Latin), Slovakça, İspanyolca, İsveççe ve Türkçe dahil olmak üzere 25 dili destekler.
Tesseract OCR altyapısını kullanma
Not
Tesseract OCR altyapısını kullanmak için makinenin CPU'sunun AVX2 yönerge kümesini desteklediğinden emin olun.
Power Automate, Windows OCR altyapısının yanı sıra Tesseract altyapısını da destekler. Bu altyapı, daha fazla yapılandırma gerektirmeden beş dilde metin ayıklayabilir: İngilizce, Almanca, İspanyolca, Fransızca ve İtalyanca.
Belirtilen listenin dışındaki bir dilde metin ayıklamak için OCR eyleminin OCR altyapısı ayarları'nda Diğer dilleri kullan seçeneğini etkinleştirin. Bu seçenek etkinleştirildiğinde eylem iki ek parametre görüntüler: Dil kısaltması ve Dil verileri yolu.
Dil kısaltması alanı, hangi dilin OCR sırasında aranması gerektiğini altyapıya gösterir. Dil verileri yolu alanı, OCR altyapısını eğitmek için kullanılan dil veri dosyalarını (.traineddata) içerir. Kullanılabilir tüm diller için dil veri dosyalarını bu GitHub deposunda bulabilirsiniz.
Tesseract altyapısını, çok dilli belgelerden metin ayıklamak için de kullanabilirsiniz. Çok dilli belgelerden metin ayıklama ile ilgili daha fazla bilgi için Çok dilli belgelerde OCR işlemi yapma bölümüne gidin.
Metin ekranda varsa (OCR)
OCR kullanarak belirli bir metnin ekranda görünüp görünmediğine göre koşullu eylemler bloğunun başlangıcını işaretler.
Giriş parametreleri
Bağımsız değişken | İsteğe bağlı | Kabul eder | Varsayılan Değer | Tanım |
---|---|---|---|---|
If text | Yok | Var, Yok | Var | Metnin analiz edilmesi için belirtilmiş kaynakta var olup olmadığının denetlenip denetlenmeyeceğini belirtir |
OCR altyapısı türü | Hayır | Windows OCR altyapısı, Tesseract altyapısı, OCR altyapısı değişkeni | OCR altyapısı değişkeni | Kullanılacak OCR altyapısı türü. Önceden yapılandırılmış bir OCR altyapısı seçin veya yeni bir altyapı ayarlayın. |
OCR altyapısı değişkeni | Hayır | OCREngineObject | OCR işlemi için kullanılacak altyapı | |
Text to find | Hayır | Metin değeri | Belirtilen kaynakta aranacak metin | |
Is regular expression | Yok | Boole değeri | Yanlış | Belirtilen metni bulmak için normal ifade kullanılıp kullanılmayacağını belirtir |
Search for text on | Yok | Tüm ekran, ön plan penceresi | Tüm ekran | Belirtilen metnin, görünür ekranın tümünde mi yoksa yalnızca ön plan penceresinde mi aranacağını belirtir |
Search mode | Geçersiz | Belirtilen kaynağın tamamı, yalnızca belirli alt bölge, görüntüye göre alt bölge | Belirtilen kaynağın tamamı | Tüm ekranın mı (ya da pencerenin), yoksa ekranın daraltılmış bir alt bölgesinin mi taranacağını belirtir |
Görüntüler | Hayır | Görüntülistesi | Sağlanan metni taramayacak alt bölgeyi (görüntünün sol üst köşesine göre) belirten görüntüler | |
X1 | Evet | Sayısal değer | Sağlanan metnin taranacağı alt bölgenin başlangıç X koordinatı | |
Tolerance | Evet | Sayısal değer | 10 | Aranan görüntülerin başlangıçta seçilen görüntüden ne kadar farklı olabileceğini belirtir |
Y1 | Evet | Sayısal değer | Sağlanan metnin taranacağı alt bölgenin başlangıç Y koordinatı | |
X1 | Evet | Sayısal değer | Sağlanan metni taramak için alt bölgenin belirtilen görüntüye göre başlangıç X koordinatı | |
X2 | Evet | Sayısal değer | Sağlanan metnin taranacağı alt bölgenin bitiş X koordinatı | |
Y1 | Evet | Sayısal değer | Sağlanan metni taramak için alt bölgenin belirtilen görüntüye göre başlangıç Y koordinatı | |
Y2 | Evet | Sayısal değer | Sağlanan metnin taranacağı alt bölgenin bitiş Y koordinatı | |
X2 | Evet | Sayısal değer | Sağlanan metni taramak için alt bölgenin belirtilen görüntüye göre bitiş X koordinatı | |
Y2 | Evet | Sayısal değer | Sağlanan metni taramak için alt bölgenin belirtilen görüntüye göre bitiş Y koordinatı | |
Windows OCR dili | Yok | Çince (Basitleştirilmiş), Çince (Geleneksel), Çekçe, Danca, Felemenkçe, İngilizce, Fince, Fransızca, Almanca, Yunanca, Macarca, İtalyanca, Japonca, Korece, Norveççe, Lehçe, Portekizce, Rumence, Rusça, Sırpça (Kiril), Sırpça (Latin), Slovakça, İspanyolca, İsveççe ve Türkçe | İngilizce | Windows OCR altyapısının algıladığı metnin dili |
Başka dil kullanma | Yok | Boole değeri | Yanlış | "Tesseract dili" alanında sağlanmamış bir dilin kullanılıp kullanılmayacağını belirtir |
Tesseract dili | Yok | İngilizce, Almanca, İspanyolca, Fransızca, İtalyanca | İngilizce | Tesseract altyapısının algıladığı metnin dili |
Dil kısaltması | Hayır | Metin değeri | Kullanılacak dilin Tesseract kısaltması. Örneğin, veriler "eng.traineddata" ise bu parametreyi "eng" olarak ayarlayın | |
Dil verileri yolu | Hayır | Metin değeri | Belirtilen dilin Tesseract verilerini içeren klasörün yolu | |
Görüntü genişliği çarpanı | Hayır | Sayısal değer | 1 | Görüntünün genişlik çarpanı |
Görüntü yüksekliği çarpanı | Hayır | Sayısal değer | 1 | Görüntünün yükseklik çarpanı |
Görüntü eşleme algoritması | Yok | Temel, Gelişmiş | Temel | Görüntü ararken kullanılacak görüntü algoritmaları |
Not
- Power Automate'in normal ifade altyapısı .NET'tir. Normal ifadeler hakkında daha fazla bilgi edinmek için Normal İfade Dili - Hızlı Başvuru bölümüne gidin.
- OCR altyapısı değişkeni seçeneğinin kullanımdan kaldırılması planlanmıştır.
Değişkenler üretildi
Bağımsız değişken | Türü | Tanım |
---|---|---|
LocationOfTextFoundX | Sayısal değer | Metnin ekranda göründüğü noktanın X koordinatı. Arama ön plan penceresinde gerçekleştirildiyse, verilen koordinat pencerenin sol üst köşesine göre olur |
LocationOfTextFoundY | Sayısal değer | Metnin ekranda göründüğü noktanın X koordinatı. Arama ön plan penceresinde gerçekleştirildiyse, verilen koordinat pencerenin sol üst köşesine göre olur |
Özel durumlar
Özel durum | Tanım |
---|---|
Metin etkileşimsiz moddayken denetleme yapılamaz | Etkileşimsiz moddayken ekrandaki metnin denetlenemediğini gösterir |
Geçersiz alt bölge koordinatları | Belirtilen alt bölge koordinatlarının geçersiz olduğunu gösterir |
OCR ile metin analiz edilemedi | OCR kullanarak metin analiz edilmeye çalışılırken bir hata oluştuğunu gösterir |
OCR altyapısı oluşturulamadı | OCR altyapısı oluşturulmaya çalışılırken bir hata oluştuğunu gösterir |
Veri yolu klasörü yok | Dil verileri için belirtilen klasörün var olmadığını gösterir |
Seçili Windows dil paketi makinede yüklü değil | Seçili Windows dil paketinin makineye yüklenmediğini gösterir |
OCR altyapısı etkin değil | OCR altyapısının etkin olmadığını gösterir |
Ekrandaki metni bekle (OCR)
Belirli bir metnin ekranda, ön plan penceresinde veya ekrandaki görüntüye ya da OCR kullanan ön plan penceresine göre görünmesini/kaybolmasını bekleyin.
Giriş parametreleri
Bağımsız değişken | İsteğe bağlı | Kabul eder | Varsayılan Değer | Tanım |
---|---|---|---|---|
Wait for text to | Yok | Görünme, Kaybolma | Görünme | Metnin görünmesinin mi yoksa kaybolmasının mı bekleneceğini belirtir |
OCR altyapısı türü | Hayır | Windows OCR altyapısı, Tesseract altyapısı, OCR altyapısı değişkeni | OCR altyapısı değişkeni | Kullanılacak OCR altyapısı türü. Önceden yapılandırılmış bir OCR altyapısı seçin veya yeni bir altyapı ayarlayın. |
OCR altyapısı değişkeni | Hayır | OCREngineObject | OCR işlemi için kullanılacak altyapı | |
Text to find | Hayır | Metin değeri | Belirtilen kaynakta aranacak metin | |
Is regular expression | Yok | Boole değeri | Yanlış | Belirtilen metni bulmak için normal ifade kullanılıp kullanılmayacağını belirtir |
Search for text on | Yok | Tüm ekran, ön plan penceresi | Tüm ekran | Belirtilen metnin, görünür ekranın tümünde mi yoksa yalnızca ön plan penceresinde mi aranacağını belirtir |
Search mode | Geçersiz | Belirtilen kaynağın tamamı, yalnızca belirli alt bölge, görüntüye göre alt bölge | Belirtilen kaynağın tamamı | Tüm ekranın mı (ya da pencerenin), yoksa ekranın daraltılmış bir alt bölgesinin mi taranacağını belirtir |
Görüntüler | Hayır | Görüntülistesi | Sağlanan metni taramayacak alt bölgeyi (görüntünün sol üst köşesine göre) belirten görüntüler | |
X1 | Evet | Sayısal değer | Sağlanan metnin taranacağı alt bölgenin başlangıç X koordinatı | |
Tolerance | Evet | Sayısal değer | 10 | Aranan görüntülerin başlangıçta seçilen görüntüden ne kadar farklı olabileceğini belirtir |
Y1 | Evet | Sayısal değer | Sağlanan metnin taranacağı alt bölgenin başlangıç Y koordinatı | |
X1 | Evet | Sayısal değer | Sağlanan metni taramak için alt bölgenin belirtilen görüntüye göre başlangıç X koordinatı | |
X2 | Evet | Sayısal değer | Sağlanan metnin taranacağı alt bölgenin bitiş X koordinatı | |
Y1 | Evet | Sayısal değer | Sağlanan metni taramak için alt bölgenin belirtilen görüntüye göre başlangıç Y koordinatı | |
Y2 | Evet | Sayısal değer | Sağlanan metnin taranacağı alt bölgenin bitiş Y koordinatı | |
X2 | Evet | Sayısal değer | Sağlanan metni taramak için alt bölgenin belirtilen görüntüye göre bitiş X koordinatı | |
Y2 | Evet | Sayısal değer | Sağlanan metni taramak için alt bölgenin belirtilen görüntüye göre bitiş Y koordinatı | |
Windows OCR dili | Yok | Çince (Basitleştirilmiş), Çince (Geleneksel), Çekçe, Danca, Felemenkçe, İngilizce, Fince, Fransızca, Almanca, Yunanca, Macarca, İtalyanca, Japonca, Korece, Norveççe, Lehçe, Portekizce, Rumence, Rusça, Sırpça (Kiril), Sırpça (Latin), Slovakça, İspanyolca, İsveççe ve Türkçe | İngilizce | Windows OCR altyapısının algıladığı metnin dili |
Başka dil kullanma | Yok | Boole değeri | Yanlış | "Tesseract dili" alanında sağlanmamış bir dilin kullanılıp kullanılmayacağını belirtir |
Tesseract dili | Yok | İngilizce, Almanca, İspanyolca, Fransızca, İtalyanca | İngilizce | Tesseract altyapısının algıladığı metnin dili |
Dil kısaltması | Hayır | Metin değeri | Kullanılacak dilin Tesseract kısaltması. Örneğin, veriler "eng.traineddata" ise bu parametreyi "eng" olarak ayarlayın | |
Dil verileri yolu | Hayır | Metin değeri | Belirtilen dilin Tesseract verilerini içeren klasörün yolu | |
Görüntü genişliği çarpanı | Hayır | Sayısal değer | 1 | Görüntünün genişlik çarpanı |
Görüntü yüksekliği çarpanı | Hayır | Sayısal değer | 1 | Görüntünün yükseklik çarpanı |
Görüntü eşleme algoritması | Yok | Temel, Gelişmiş | Temel | Görüntü ararken kullanılacak görüntü algoritmaları |
Zaman aşımı hatasıyla başarısız oldu | Yok | Boole değeri | Yanlış | Eylemin süresiz olarak beklemesini mi yoksa belirtilen süre sonunda başarısız olmasını mı istediğinizi belirtin |
Not
- Power Automate'in normal ifade altyapısı .NET'tir. Normal ifadeler hakkında daha fazla bilgi edinmek için Normal İfade Dili - Hızlı Başvuru bölümüne gidin.
- OCR altyapısı değişkeni seçeneğinin kullanımdan kaldırılması planlanmıştır.
Değişkenler üretildi
Bağımsız değişken | Türü | Tanım |
---|---|---|
LocationOfTextFoundX | Sayısal değer | Metnin ekranda göründüğü noktanın X koordinatı. Arama ön plan penceresinde gerçekleştirildiyse, verilen koordinat pencerenin sol üst köşesine göre olur |
LocationOfTextFoundY | Sayısal değer | Metnin ekranda göründüğü noktanın X koordinatı. Arama ön plan penceresinde gerçekleştirildiyse, verilen koordinat pencerenin sol üst köşesine göre olur |
Özel durumlar
Özel durum | Tanım |
---|---|
Metin etkileşimsiz moddayken denetleme yapılamaz | Etkileşimsiz moddayken ekrandaki metnin denetlenemediğini gösterir |
Geçersiz alt bölge koordinatları | Belirtilen alt bölge koordinatlarının geçersiz olduğunu gösterir |
OCR ile metin analiz edilemedi | OCR kullanarak metin analiz edilmeye çalışılırken bir hata oluştuğunu gösterir |
OCR altyapısı oluşturulamadı | OCR altyapısı oluşturulmaya çalışılırken bir hata oluştuğunu gösterir |
Veri yolu klasörü yok | Dil verileri için belirtilen klasörün var olmadığını gösterir |
Seçili Windows dil paketi makinede yüklü değil | Seçili Windows dil paketinin makineye yüklenmediğini gösterir |
OCR altyapısı etkin değil | OCR altyapısının etkin olmadığını gösterir |
Zaman aşımı hatası | Eylemin belirli bir süre sonra başarısız olduğunu belirtir |
OCR ile metin ayıkla
Belirli bir OCR altyapısını kullanarak belirli bir kaynaktaki metni ayıklayın.
Giriş parametreleri
Bağımsız değişken | İsteğe bağlı | Kabul eder | Varsayılan Değer | Tanım |
---|---|---|---|---|
OCR altyapısı | Hayır | Windows OCR altyapısı, Tesseract altyapısı, OCR altyapısı değişkeni | OCR altyapısı değişkeni | Kullanılacak OCR altyapısı türü. Önceden yapılandırılmış bir OCR altyapısı seçin veya yeni bir altyapı ayarlayın |
OCR altyapısı değişkeni | Hayır | OCREngineObject | OCR işlemi için kullanılacak altyapı | |
OCR source | Yok | Ekran, ön plan penceresi, diskteki görüntü | Ekran | OCR işleminin gerçekleştirileceği görüntünün kaynağı |
Image file path | Hayır | Dosya | OCR işleminin gerçekleştirileceği görüntünün yolu | |
Search mode | Yok | Belirtilen kaynağın tamamı, yalnızca belirli alt bölge, görüntüye göre alt bölge | Belirtilen kaynağın tamamı | OCR işlemi için seçilen mod |
Görüntü | Hayır | Görüntülistesi | Taramayı, belirtilen görüntüye göre bir alt bölgeye daraltmak için kullanılacak görüntü | |
Tolerance | Evet | Sayısal değer | 10 | Görüntünün başlangıçta seçilen görüntüden ne kadar farklı olabileceğini belirtir |
X1 | Evet | Sayısal değer | Taramanın daraltılacağı alt bölgenin başlangıç X koordinatı | |
X2 | Evet | Sayısal değer | Taramayı daraltmaya yönelik alt bölgenin bitiş X koordinatı | |
Y1 | Evet | Sayısal değer | Taramayı daraltmaya yönelik alt bölgenin başlangıç Y koordinatı | |
Y2 | Evet | Sayısal değer | Taramayı daraltmaya yönelik alt bölgenin bitiş Y koordinatı | |
Windows OCR dili | Yok | Çince (Basitleştirilmiş), Çince (Geleneksel), Çekçe, Danca, Felemenkçe, İngilizce, Fince, Fransızca, Almanca, Yunanca, Macarca, İtalyanca, Japonca, Korece, Norveççe, Lehçe, Portekizce, Rumence, Rusça, Sırpça (Kiril), Sırpça (Latin), Slovakça, İspanyolca, İsveççe ve Türkçe | İngilizce | Windows OCR altyapısının algıladığı metnin dili |
Başka dil kullanma | Yok | Boole değeri | Yanlış | "Tesseract dili" alanında sağlanmamış bir dilin kullanılıp kullanılmayacağını belirtir |
Tesseract dili | Yok | İngilizce, Almanca, İspanyolca, Fransızca, İtalyanca | İngilizce | Tesseract altyapısının algıladığı metnin dili |
Dil kısaltması | Hayır | Metin değeri | Kullanılacak dilin Tesseract kısaltması. Örneğin, veriler "eng.traineddata" ise bu parametreyi "eng" olarak ayarlayın | |
Dil verileri yolu | Hayır | Metin değeri | Belirtilen dilin Tesseract verilerini içeren klasörün yolu | |
Görüntü genişliği çarpanı | Hayır | Sayısal değer | 1 | Görüntünün genişlik çarpanı |
Görüntü yüksekliği çarpanı | Hayır | Sayısal değer | 1 | Görüntünün yükseklik çarpanı |
Görüntünün görünmesini bekleyin | Yok | Boole değeri | Doğru | Görüntünün ekranda veya ön plan penceresinde görünmesinin beklenip beklenmeyeceğini belirtir |
Zaman aşımı | Hayır | Sayısal değer | 5 | Eylem başarısız olmadan önce işlemin tamamlanması için beklenecek süreyi belirtir |
Görüntü eşleme algoritması | Yok | Temel, Gelişmiş | Temel | Görüntü ararken kullanılacak görüntü algoritmaları |
Not
OCR altyapısı değişkeni seçeneğinin kullanımdan kaldırılması planlanmıştır.
Değişkenler üretildi
Bağımsız değişken | Türü | Tanım |
---|---|---|
OcrText | Metin değeri | Metin ayıklama işleminden sonraki sonuç |
Özel durumlar
Özel durum | Açıklama |
---|---|
OCR ile metin ayıklanamadı | Verilen kaynaktan OCR ile metin ayıklamaya çalışılırken oluşan bir hata oluştuğunu gösterir |
Görüntü bulunamadı | Dosyanın verilen yolda olmadığını gösterir |
Yer işareti görüntüsü bulunamadı | Yer işareti görüntüsünün var olmadığını gösterir |
Etkileşimsiz moddayken ekrandan metin alınamaz | Etkileşimsiz moddayken ekrandan metnin alınamayacağını gösterir |
OCR altyapısı oluşturulamadı | OCR altyapısı oluşturulmaya çalışılırken bir hata oluştuğunu gösterir |
Veri yolu klasörü yok | Dil verileri için belirtilen klasörün var olmadığını gösterir |
Seçili Windows dil paketi makinede yüklü değil | Seçili Windows dil paketinin makineye yüklenmediğini gösterir |
OCR altyapısı etkin değil | OCR altyapısının etkin olmadığını gösterir |