Självstudie: Köra en TensorFlow-modell i Python

Artikel
09/02/2024

Den här självstudien visar hur du använder en exporterad TensorFlow-modell lokalt för att klassificera bilder.

Kommentar

Den här självstudien gäller endast modeller som exporteras från bildklassificeringsprojekt med "Allmänt (kompakt)." Om du har exporterat andra modeller kan du besöka vår exempelkodlagringsplats.

Förutsättningar

Installera antingen Python 2.7+ eller Python 3.6+.
Installera pip.

Därefter måste du installera följande paket:

pip install tensorflow
pip install pillow
pip install numpy
pip install opencv-python

Läsa in din modell och dina taggar

Den nedladdade .zip filen från exportsteget innehåller en model.pb och en labels.txt fil. De här filerna representerar den tränade modellen och klassificeringsetiketterna. Det första steget är att läsa in modellen i projektet. Lägg till följande kod i ett nytt Python-skript.

import tensorflow as tf
import os

graph_def = tf.compat.v1.GraphDef()
labels = []

# These are set to the default names from exported models, update as needed.
filename = "model.pb"
labels_filename = "labels.txt"

# Import the TF graph
with tf.io.gfile.GFile(filename, 'rb') as f:
    graph_def.ParseFromString(f.read())
    tf.import_graph_def(graph_def, name='')

# Create a list of labels.
with open(labels_filename, 'rt') as lf:
    for l in lf:
        labels.append(l.strip())

Förbereda en bild för förutsägelse

Det finns några steg du behöver vidta för att förbereda en bild för förutsägelse. De här stegen efterliknar den bildmanipulering som utförs under träningen.

Öppna filen och skapa en bild i BGR-färgområdet

from PIL import Image
import numpy as np
import cv2

# Load from a file
imageFile = "<path to your image file>"
image = Image.open(imageFile)

# Update orientation based on EXIF tags, if the file has orientation info.
image = update_orientation(image)

# Convert to OpenCV format
image = convert_to_opencv(image)

Om bilden har en dimension som är större än 1 600 bildpunkter anropar du den här metoden (definieras senare).
```
image = resize_down_to_1600_max_dim(image)
```

Beskär den största centrala fyrkanten

h, w = image.shape[:2]
min_dim = min(w,h)
max_square_image = crop_center(image, min_dim, min_dim)

Ändra storlek på kvadraten till 256x256

augmented_image = resize_to_256_square(max_square_image)

Beskär mitten för den specifika indatastorleken för modellen

# Get the input size of the model
with tf.compat.v1.Session() as sess:
    input_tensor_shape = sess.graph.get_tensor_by_name('Placeholder:0').shape.as_list()
network_input_size = input_tensor_shape[1]

# Crop the center for the specified network_input_Size
augmented_image = crop_center(augmented_image, network_input_size, network_input_size)

Definiera hjälpfunktioner. Stegen ovan använder följande hjälpfunktioner:

def convert_to_opencv(image):
    # RGB -> BGR conversion is performed as well.
    image = image.convert('RGB')
    r,g,b = np.array(image).T
    opencv_image = np.array([b,g,r]).transpose()
    return opencv_image

def crop_center(img,cropx,cropy):
    h, w = img.shape[:2]
    startx = w//2-(cropx//2)
    starty = h//2-(cropy//2)
    return img[starty:starty+cropy, startx:startx+cropx]

def resize_down_to_1600_max_dim(image):
    h, w = image.shape[:2]
    if (h < 1600 and w < 1600):
        return image

    new_size = (1600 * w // h, 1600) if (h > w) else (1600, 1600 * h // w)
    return cv2.resize(image, new_size, interpolation = cv2.INTER_LINEAR)

def resize_to_256_square(image):
    h, w = image.shape[:2]
    return cv2.resize(image, (256, 256), interpolation = cv2.INTER_LINEAR)

def update_orientation(image):
    exif_orientation_tag = 0x0112
    if hasattr(image, '_getexif'):
        exif = image._getexif()
        if (exif != None and exif_orientation_tag in exif):
            orientation = exif.get(exif_orientation_tag, 1)
            # orientation is 1 based, shift to zero based and flip/transpose based on 0-based values
            orientation -= 1
            if orientation >= 4:
                image = image.transpose(Image.TRANSPOSE)
            if orientation == 2 or orientation == 3 or orientation == 6 or orientation == 7:
                image = image.transpose(Image.FLIP_TOP_BOTTOM)
            if orientation == 1 or orientation == 2 or orientation == 5 or orientation == 6:
                image = image.transpose(Image.FLIP_LEFT_RIGHT)
    return image

Klassificera en bild

När avbildningen har förberetts som en tensor kan vi skicka den via modellen för en förutsägelse.

# These names are part of the model and cannot be changed.
output_layer = 'loss:0'
input_node = 'Placeholder:0'

with tf.compat.v1.Session() as sess:
    try:
        prob_tensor = sess.graph.get_tensor_by_name(output_layer)
        predictions = sess.run(prob_tensor, {input_node: [augmented_image] })
    except KeyError:
        print ("Couldn't find classification output layer: " + output_layer + ".")
        print ("Verify this a model exported from an Object Detection project.")
        exit(-1)

Visa resultat

Resultatet av körningen av bildtensorn genom modellen behöver sedan mappas tillbaka till etiketterna.

    # Print the highest probability label
    highest_probability_index = np.argmax(predictions)
    print('Classified as: ' + labels[highest_probability_index])
    print()

    # Or you can print out all of the results mapping labels to probabilities.
    label_index = 0
    for p in predictions:
        truncated_probablity = np.float64(np.round(p,8))
        print (labels[label_index], truncated_probablity)
        label_index += 1

Nästa steg

Lär dig sedan hur du omsluter din modell till ett mobilprogram:

Dela via