Source code for utilities.segmentation_utils.ImagePreprocessor

from dataclasses import dataclass
from typing import Callable, Dict, Optional, Protocol

import numpy as np
import tensorflow as tf


[docs]class PreprocessorInterface(Protocol):
    queue: list[Callable]
    arguments: list[Dict]

[docs]    def update_seed(self, seed: int) -> None:
        ...

[docs]    def get_queue_length(self) -> int:
        ...


[docs]@dataclass
class PreprocessingQueue:
    """
    object to initialize a preprocessing queue

    Parameters
    ----------
    :queue list: list of functions to be applied
    :arguments list[dict]: list of arguments to be passed to the functions
    """

    queue: list[Callable]
    arguments: list[Dict]

[docs]    def update_seed(self, seed):
        """
        Changes the seed of the queue

        Parameters
        ----------
        :seed int: seed to be changed to
        """
        for i in self.arguments:
            i["seed"] = seed

[docs]    def get_queue_length(self) -> int:
        """
        Returns the length of the queue

        Returns
        -------
        :return int: length of the queue
        """
        return len(self.queue)


[docs]def generate_default_queue(seed=0) -> tuple[PreprocessingQueue, PreprocessingQueue]:
    """
    Generates the default processing queue

    Keyword Arguments
    -----------------
    :seed int: seed to be used for the random functions

    Returns
    -------
    :return PreprocessingQueue: default queue
    """
    image_queue = PreprocessingQueue(
        queue=[
            tf.image.random_flip_left_right,
            tf.image.random_flip_up_down,
            tf.image.random_brightness,
            tf.image.random_contrast,
            tf.image.random_saturation,
            tf.image.random_hue,
        ],
        arguments=[
            {"seed": seed},
            {"seed": seed},
            {"max_delta": 0.2, "seed": seed},
            {"lower": 0.8, "upper": 1.2, "seed": seed},
            {"lower": 0.8, "upper": 1.2, "seed": seed},
            {"max_delta": 0.2, "seed": seed},
        ],
    )
    mask_queue = PreprocessingQueue(
        queue=[
            tf.image.random_flip_left_right,
            tf.image.random_flip_up_down,
        ],
        arguments=[
            {"seed": seed},
            {"seed": seed},
        ],
    )
    return image_queue, mask_queue


[docs]def onehot_encode(masks, output_size, num_classes) -> tf.Tensor:
    """
    Function that one-hot encodes masks

    :batch(tf.Tensor) masks: Masks to be encoded
    :tuple(int, int) output_size: Output size of the masks
    :int num_classes: Number of classes in the masks

    Returns
    -------
    :return tf.Tensor: Batch of one-hot encoded masks
    """
    #!TODO: add support for 1D masks
    encoded = np.zeros((masks.shape[0], output_size[0], output_size[1], num_classes))
    for i in range(num_classes):
        mask = (masks == i).astype(float)
        encoded[:, :, :, i] = mask
    if output_size[1] == 1:
        encoded = encoded.reshape(
            (masks.shape[0], output_size[0] * output_size[1], num_classes)
        )
    encoded = tf.convert_to_tensor(encoded)
    return encoded


[docs]def augmentation_pipeline(
    image,
    mask,
    input_size: tuple[int, int],
    output_size: tuple[int, int],
    image_queue: PreprocessingQueue,
    mask_queue: PreprocessingQueue,
    output_reshape: Optional[tuple[int, int]] = None,
    channels: int = 3,
    seed: int = 0,
) -> tuple[tf.Tensor, tf.Tensor]:
    """
    Function that can execute a set of predifined augmentation functions
    stored in a PreprocessingQueue object. It augments both the image and the mask
    with the same functions and arguments.

    Parameters
    ----------
    :tf.Tensor image: The image to be processed
    :tf.Tensor mask: The mask to be processed
    :tuple(int, int) input_size: Input size of the image
    :tuple(int, int) output_size: Output size of the image


    Keyword Arguments
    -----------------
    :tuple(int, int), optional output_reshape: In case the image is a column vector, \
    this is the shape it should be reshaped to. Defaults to None.

    :PreprocessingQueue, optional mask_queue image_queue: \
    Augmentation processing queue for images, defaults to None

    :PreprocessingQueue, optional mask_queue: Augmentation processing queue \
    for masks, defaults to None

    :int, optional channels: Number of bands in the image, defaults to 3 \
    :int, optional seed: The seed to be used in the pipeline, defaults to 0

    Raises
    ------
    :raises ValueError: If only one of the queues is passed

    Returns
    -------
    :return tuple(tf.Tensor, tf.Tensor): tuple of the processed image and mask
    """

    # reshapes masks, such that transforamtions work properly
    if output_reshape is not None and output_size[1] == 1:
        mask = tf.reshape(mask, (output_reshape[0], output_reshape[1]))

    mask = tf.expand_dims(mask, axis=-1)

    image_queue.update_seed(seed)
    mask_queue.update_seed(seed)

    for i, fun in enumerate(image_queue.queue):
        image = fun(image, **image_queue.arguments[i])

    for i, fun in enumerate(mask_queue.queue):
        mask = fun(mask, **mask_queue.arguments[i])

    # flattens masks out to the correct output shape
    if output_size[1] == 1:
        mask = flatten(mask, output_size, channels=1)
    else:
        mask = tf.squeeze(mask, axis=-1)

    mask = tf.convert_to_tensor(mask)
    # image = tf.convert_to_tensor(tf.clip_by_value(image, 0, 1))

    return image, mask


[docs]def flatten(image, input_size, channels=1) -> tf.Tensor:
    """flatten
    Function that flattens an image preserving the number of channels

    Parameters
    ----------
    :tf.Tensor image: image to be flattened
    :tuple(int, int) input_size: input size of the image

    Keyword Arguments
    -----------------
    :int, optional channels: number of chanels to preserve, defaults to 1

    Returns
    -------
    :return tf.Tensor: flattened image
    """
    # the 1 is required to preserve the shape similar to the original
    return tf.convert_to_tensor(tf.reshape(image, (input_size[0] * input_size[1], channels)))


[docs]def random_flip_up_down(image, seed=0) -> tf.Tensor:
    """
    Function that randomly flips an image up or down

    Parameters
    ----------
    :tf.Tensor image: image to be flipped

    Returns
    -------
    :return tf.Tensor: flipped image
    """

    state = np.random.RandomState(seed)
    flip = state.choice([True, False])
    if flip:
        return tf.convert_to_tensor(tf.image.flip_up_down(image))
    else:
        return image


[docs]def random_flip_left_right(image, seed=0) -> tf.Tensor:
    """
    Function that randomly flips an image left or right

    Parameters
    ----------
    :tf.Tensor image: image to be flipped

    Returns
    -------
    :return tf.Tensor: flipped image
    """

    state = np.random.RandomState(seed)
    flip = state.choice([True, False])
    if flip:
        return tf.convert_to_tensor(tf.image.flip_left_right(image))
    else:
        return image