Source code for model_registry._client

"""Standard client for the model registry."""

from __future__ import annotations

import contextlib
import inspect
import logging
import os
from collections.abc import Awaitable, Coroutine, Mapping
from dataclasses import asdict
from pathlib import Path
from typing import (
    Any,
    Callable,
    TypeVar,
    Union,
    get_args,
    overload,
)
from warnings import warn

from model_registry.types.artifacts import ExperimentRunArtifact

from ._experiments import ActiveExperimentRun, RunContext
from .core import ModelRegistryAPIClient
from .exceptions import StoreError
from .types import (
    Experiment,
    ExperimentRun,
    ListOptions,
    ModelArtifact,
    ModelVersion,
    Pager,
    RegisteredModel,
    SupportedTypes,
)
from .utils import (
    OCIParams,
    S3Params,
    ThreadSafeVariable,
    _connect_to_s3,
    _s3_creds,
    _upload_to_s3,
    generate_name,
    required_args,
    save_to_oci_registry,
)

ModelTypes = Union[RegisteredModel, ModelVersion, ModelArtifact, Experiment]
TModel = TypeVar("TModel", bound=ModelTypes)

logging.basicConfig(
    format="%(asctime)s.%(msecs)03d - %(name)s:%(levelname)s: %(message)s",
    datefmt="%H:%M:%S",
    level=logging.WARNING,  # the default loglevel
    handlers=[
        # logging.FileHandler(
        #     LOGS
        #     / "log-{}-{}.log".format(
        #         datetime.now(tz=datetime.now().astimezone().tzinfo).strftime(
        #             "%Y-%m-%d-%H-%M-%S"
        #         ),
        #         os.getpid(),
        #     ),
        #     encoding="utf-8",
        #     delay=False,
        # ),
        logging.StreamHandler(),
    ],
)

logger = logging.getLogger("model-registry")

DEFAULT_USER_TOKEN_ENVVAR = "KF_PIPELINES_SA_TOKEN_PATH"  # noqa: S105
DEFAULT_K8S_SA_TOKEN_PATH = "/var/run/secrets/kubernetes.io/serviceaccount/token"  # noqa: S105



[docs]
class ModelRegistry:
    """Model registry client."""

    def __init__(  # noqa: C901
        self,
        server_address: str,
        port: int = 443,
        *,
        author: str,
        is_secure: bool = True,
        user_token: str | None = None,
        user_token_envvar: str | None = None,
        custom_ca: str | None = None,
        custom_ca_envvar: str | None = None,
        log_level: int = logging.WARNING,
        async_runner: Callable[[Coroutine[Any, Any, Any]], Any] = None,
    ):
        """Constructor.

        Args:
            server_address: Server address.
            port: Server port. Defaults to 443.

        Keyword Args:
            author: Name of the author.
            is_secure: Whether to use a secure connection. Defaults to True.
            user_token: The PEM-encoded user token as a string.
            user_token_envvar: Environment variable to read the user token from if it's not passed as an arg. Defaults to KF_PIPELINES_SA_TOKEN_PATH.
            custom_ca: Path to the PEM-encoded root certificates as a string.
            custom_ca_envvar: Environment variable to read the custom CA from if it's not passed as an arg.
            log_level: Log level. Defaults to logging.WARNING.
            async_runner: A modular async scheduler Callable (either a method or function) that takes in a coroutine for scheduling.
        """
        logger.setLevel(log_level)

        # TODO: get remaining args from env
        self._author = author
        # Set the user's defined async runner
        if async_runner:
            if not (inspect.ismethod(async_runner) or inspect.isfunction(async_runner)):
                msg = "`async_runner` must be a bound method or a function that takes in a coroutine to run."
                raise ValueError(msg)
            self._user_async_runner = async_runner
        else:
            import nest_asyncio

            logger.debug("Setting up reentrant async event loop")
            nest_asyncio.apply()

        if not user_token:
            user_token = self._get_user_token(user_token_envvar)
            if not user_token:
                warn("User access token is missing", stacklevel=2)

        self.hint_server_address_port(server_address, port)
        if is_secure:
            if not custom_ca and custom_ca_envvar and (cert := os.getenv(custom_ca_envvar)):
                logger.info(
                    "Using custom CA envvar %s",
                    custom_ca_envvar,
                )
                custom_ca = cert
                # client might have a default CA setup

            if not user_token:
                msg = "user token must be provided for secure connection"
                raise StoreError(msg)

            self._api = ModelRegistryAPIClient.secure_connection(
                server_address, port, user_token=user_token, custom_ca=custom_ca
            )
        else:
            self._api = ModelRegistryAPIClient.insecure_connection(server_address, port, user_token)
        self._active_experiment_context = ThreadSafeVariable(value=RunContext())
        self.get_registered_models().page_size(1)._next_page()

    @staticmethod
    def _get_user_token(user_token_envvar: str | None = None) -> str | None:
        sa_token_path: str
        user_provided: bool = True
        if user_token_envvar:
            try:
                sa_token_path = os.environ[user_token_envvar]
            except KeyError:
                msg = f"user_token_envvar is {user_token_envvar!r} but no such env var is set"
                raise ValueError(msg) from None
            logger.info(
                "Reading user token from path: user_token_envvar %r specifies path %r",
                user_token_envvar,
                sa_token_path,
            )
        elif DEFAULT_USER_TOKEN_ENVVAR in os.environ:
            sa_token_path = os.environ[DEFAULT_USER_TOKEN_ENVVAR]
            logger.info(
                "Reading user token from path: The default user token env var value %r specifies path %r",
                DEFAULT_USER_TOKEN_ENVVAR,
                sa_token_path,
            )
        else:
            sa_token_path = DEFAULT_K8S_SA_TOKEN_PATH
            user_provided = False
            logger.info(
                "Reading user token from path: No user_token_envvar. Attempting to read from default K8s service account path %r",
                DEFAULT_K8S_SA_TOKEN_PATH,
            )
        try:
            return Path(sa_token_path).read_text()
        except OSError as exc:
            msg = f"Unable read user token from {sa_token_path!r}"
            if user_provided:
                raise StoreError(msg) from exc
            logger.info(msg)
        return None


[docs]
    @staticmethod
    def hint_server_address_port(server_address: str, port: int) -> None:
        """Hint based on server_address protocol if the port may not be the correct one."""
        if server_address.startswith("https://") and not str(port).endswith("443"):
            logger.warning(
                "Server address protocol is https://, but port is not 443 or ending with 443. You may want to verify the configuration is correct."
            )
        if server_address.startswith("http://") and not str(port).endswith("80"):
            logger.warning(
                "Server address protocol is http://, but port is not 80 or ending with 80. You may want to verify the configuration is correct."
            )


    def async_runner(self, coro: Awaitable[TModel]) -> TModel:
        if hasattr(self, "_user_async_runner"):
            return self._user_async_runner(coro)

        import asyncio

        try:
            loop = asyncio.get_event_loop()
        except RuntimeError:
            loop = asyncio.new_event_loop()
            asyncio.set_event_loop(loop)
        return loop.run_until_complete(coro)

    async def _register_model(self, name: str, **kwargs) -> RegisteredModel:
        if rm := await self._api.get_registered_model_by_params(name):
            return rm

        return await self._api.upsert_registered_model(RegisteredModel(name=name, **kwargs))

    async def _register_new_version(self, rm: RegisteredModel, version: str, author: str, /, **kwargs) -> ModelVersion:
        assert rm.id is not None, "Registered model must have an ID"
        if await self._api.get_model_version_by_params(rm.id, version):
            msg = f"Version {version} already exists"
            raise StoreError(msg)

        return await self._api.upsert_model_version(ModelVersion(name=version, author=author, **kwargs), rm.id)

    async def _register_model_artifact(self, mv: ModelVersion, name: str, uri: str, /, **kwargs) -> ModelArtifact:
        assert mv.id is not None, "Model version must have an ID"
        return await self._api.upsert_model_version_artifact(ModelArtifact(name=name, uri=uri, **kwargs), mv.id)


[docs]
    def upload_artifact_and_register_model(
        self,
        name: str,
        model_files_path: str,
        *,
        # Upload/client Params
        upload_params: OCIParams | S3Params,
        # Artifact/Model Params
        version: str,
        model_format_name: str,
        model_format_version: str,
        storage_path: str | None = None,
        storage_key: str | None = None,
        service_account_name: str | None = None,
        author: str | None = None,
        owner: str | None = None,
        description: str | None = None,
        metadata: Mapping[str, SupportedTypes] | None = None,
    ) -> RegisteredModel:
        """Convenience method to perform 2 operations; uploading an artifact to a storage location, and registers the model in model registry.

        Args:
            name: Name of the model.
            model_files_path: The path where the model files are located. If a directory, uploads the entire directory.

        Keyword Args:
            upload_params: Parameters to configure which storage client to use as well as that client's configuration when uploading the model.
            version: Version of the model. Has to be unique.
            model_format_name: Name of the model format.
            model_format_version: Version of the model format.
            description: Description of the model.
            author: Author of the model. Defaults to the client author.
            owner: Owner of the model. Defaults to the client author.
            storage_key: Storage key.
            storage_path: Storage path.
            service_account_name: Service account name.
            metadata: Additional version metadata. Defaults to values returned by `default_metadata()`.

        Raises:
            ValueError: When the provided `upload_params` is missing or invalid

        Returns:
            Registered model. See: :meth:`~ModelRegistry.register_model`
        """
        # Check if model does not already exist in Registry
        ver = None
        with contextlib.suppress(StoreError):
            ver = self.get_model_version(name=name, version=version)

        if ver:
            msg = f"Model `{name}:{version}` already exists in Model Registry."
            raise StoreError(msg)

        if isinstance(upload_params, S3Params):
            destination_uri = self.save_to_s3(**asdict(upload_params), path=model_files_path)
        elif isinstance(upload_params, OCIParams):
            dict_params = asdict(upload_params)
            del dict_params["custom_oci_backend"]
            destination_uri = save_to_oci_registry(
                **dict_params,
                custom_oci_backend=upload_params.custom_oci_backend,
                model_files_path=model_files_path,
            )
        else:
            msg = 'Param "upload_params" is required to perform an upload. Please ensure the value provided is valid'
            raise ValueError(msg)

        return self.register_model(
            name,
            destination_uri,
            model_format_name=model_format_name,
            model_format_version=model_format_version,
            version=version,
            storage_key=storage_key,
            storage_path=storage_path,
            service_account_name=service_account_name,
            author=author,
            owner=owner,
            description=description,
            metadata=metadata,
        )



[docs]
    def register_model(
        self,
        name: str,
        uri: str,
        *,
        model_format_name: str,
        model_format_version: str,
        version: str,
        storage_key: str | None = None,
        storage_path: str | None = None,
        service_account_name: str | None = None,
        model_source_kind: str | None = None,
        model_source_class: str | None = None,
        model_source_group: str | None = None,
        model_source_id: str | None = None,
        model_source_name: str | None = None,
        author: str | None = None,
        owner: str | None = None,
        description: str | None = None,
        metadata: Mapping[str, SupportedTypes] | None = None,
    ) -> RegisteredModel:
        """Register a model.

        This registers a model in the model registry. The model is not downloaded, and has to be stored prior to
        registration.

        Most models can be registered using their URI, along with optional connection-specific parameters, `storage_key`
        and `storage_path` or, simply a `service_account_name`.
        URI builder utilities are recommended when referring to specialized storage; for example `utils.s3_uri_from`
        helper when using S3 object storage data connections.

        Args:
            name: Name of the model.
            uri: URI of the model.

        Keyword Args:
            version: Version of the model. Has to be unique.
            model_format_name: Name of the model format.
            model_format_version: Version of the model format.
            description: Description of the model.
            author: Author of the model. Defaults to the client author.
            owner: Owner of the model. Defaults to the client author.
            storage_key: Storage key.
            storage_path: Storage path.
            service_account_name: Service account name.
            model_source_kind: A string identifier describing the source kind.
            model_source_class: A subgroup within the source kind.
            model_source_group: This identifies a source group for models from source class.
            model_source_id: A unique identifier for a source model within kind, class, and group.
            model_source_name: A human-readable name for the source model.
            metadata: Additional version metadata. Defaults to values returned by `default_metadata()`.

        Returns:
            Registered model.
        """
        rm = self.async_runner(self._register_model(name, owner=owner or self._author))
        mv = self.async_runner(
            self._register_new_version(
                rm,
                version,
                author or self._author,
                description=description,
                custom_properties=metadata or {},
            )
        )
        self.async_runner(
            self._register_model_artifact(
                mv,
                name,
                uri,
                model_format_name=model_format_name,
                model_format_version=model_format_version,
                storage_key=storage_key,
                storage_path=storage_path,
                service_account_name=service_account_name,
                model_source_kind=model_source_kind,
                model_source_class=model_source_class,
                model_source_group=model_source_group,
                model_source_id=model_source_id,
                model_source_name=model_source_name,
            )
        )

        return rm



[docs]
    def update(self, model: TModel) -> TModel:
        """Update a model."""
        if not model.id:
            msg = "Model must have an ID"
            raise StoreError(msg)
        if not isinstance(model, get_args(ModelTypes)):
            msg = f"Model must be one of {get_args(ModelTypes)}"
            raise StoreError(msg)
        if isinstance(model, RegisteredModel):
            return self.async_runner(self._api.upsert_registered_model(model))
        if isinstance(model, ModelVersion):
            return self.async_runner(self._api.upsert_model_version(model, None))
        return self.async_runner(self._api.upsert_model_artifact(model))



[docs]
    def register_hf_model(
        self,
        repo: str,
        path: str,
        *,
        version: str,
        model_format_name: str,
        model_format_version: str,
        author: str | None = None,
        owner: str | None = None,
        model_name: str | None = None,
        description: str | None = None,
        git_ref: str = "main",
    ) -> RegisteredModel:
        """Register a Hugging Face model.

        This imports a model from Hugging Face hub and registers it in the model registry.
        Note that the model is not downloaded.

        Args:
            repo: Name of the repository from Hugging Face hub.
            path: URI of the model.

        Keyword Args:
            version: Version of the model. Has to be unique.
            model_format_name: Name of the model format.
            model_format_version: Version of the model format.
            author: Author of the model. Defaults to repo owner.
            owner: Owner of the model. Defaults to the client author.
            model_name: Name of the model. Defaults to the repo name.
            description: Description of the model.
            git_ref: Git reference to use. Defaults to `main`.

        Returns:
            Registered model.
        """
        try:
            from huggingface_hub import HfApi, hf_hub_url, utils
        except ImportError as e:
            msg = """package `huggingface-hub` is not installed.
            To import models from Hugging Face Hub, start by installing the `huggingface-hub` package,
            either directly or as an extra (available as `model-registry[hf]`), e.g.:
            ```sh
            !pip install --pre model-registry[hf]
            ```
            or
            ```sh
            !pip install huggingface-hub
            ```
            """
            raise StoreError(msg) from e

        api = HfApi()
        try:
            model_info = api.model_info(repo, revision=git_ref)
        except utils.RepositoryNotFoundError as e:
            msg = f"Repository {repo} does not exist"
            raise StoreError(msg) from e
        except utils.RevisionNotFoundError as e:
            # TODO: as all hf-hub client calls default to using main, should we provide a tip?
            msg = f"Revision {git_ref} does not exist"
            raise StoreError(msg) from e

        if not author:
            # model author can be None if the repo is in a "global" namespace (i.e. no / in repo).
            if model_info.author is None:
                model_author = "unknown"
                warn(
                    "Model author is unknown. This is likely because the model is in a global namespace.",
                    stacklevel=2,
                )
            else:
                model_author = model_info.author
        else:
            model_author = author
        source_uri = hf_hub_url(repo, path, revision=git_ref)
        metadata = {
            "repo": repo,
            "source_uri": source_uri,
            "model_origin": "huggingface_hub",
            "model_author": model_author,
        }
        # card_data is the new field, but let's use the old one for backwards compatibility.
        if card_data := model_info.cardData:
            metadata.update(
                {
                    k: v
                    for k, v in card_data.to_dict().items()
                    # TODO: (#151) preserve tags, possibly other complex metadata
                    if isinstance(v, get_args(SupportedTypes))
                }
            )
        return self.register_model(
            model_name or model_info.id,
            source_uri,
            author=author or model_author,
            owner=owner or self._author,
            version=version,
            model_format_name=model_format_name,
            model_format_version=model_format_version,
            description=description,
            storage_path=path,
            metadata=metadata,
        )



[docs]
    def get_registered_model(self, name: str) -> RegisteredModel | None:
        """Get a registered model.

        Args:
            name: Name of the model.

        Returns:
            Registered model.
        """
        return self.async_runner(self._api.get_registered_model_by_params(name))



[docs]
    def get_model_version(self, name: str, version: str) -> ModelVersion | None:
        """Get a model version.

        Args:
            name: Name of the model.
            version: Version of the model.

        Returns:
            Model version.

        Raises:
            StoreException: If the model does not exist.
        """
        if not (rm := self.get_registered_model(name)):
            msg = f"Model {name} does not exist"
            raise StoreError(msg)
        assert rm.id
        return self.async_runner(self._api.get_model_version_by_params(rm.id, version))



[docs]
    def get_model_artifact(self, name: str, version: str) -> ModelArtifact | None:
        """Get a model artifact.

        Args:
            name: Name of the model.
            version: Version of the model.

        Returns:
            Model artifact.

        Raises:
            StoreException: If either the model or the version don't exist.
        """
        if not (mv := self.get_model_version(name, version)):
            msg = f"Version {version} does not exist"
            raise StoreError(msg)
        assert mv.id
        return self.async_runner(self._api.get_model_artifact_by_params(name, mv.id))



[docs]
    def get_registered_models(self) -> Pager[RegisteredModel]:
        """Get a pager for registered models.

        Returns:
            Iterable pager for registered models.
        """

        def rm_list(options: ListOptions) -> list[RegisteredModel]:
            return self.async_runner(self._api.get_registered_models(options))

        return Pager[RegisteredModel](rm_list)



[docs]
    def get_model_versions(self, name: str) -> Pager[ModelVersion]:
        """Get a pager for model versions.

        Args:
            name: Name of the model.

        Returns:
            Iterable pager for model versions.

        Raises:
            StoreException: If the model does not exist.
        """
        if not (rm := self.get_registered_model(name)):
            msg = f"Model {name} does not exist"
            raise StoreError(msg)

        def rm_versions(options: ListOptions) -> list[ModelVersion]:
            # type checkers can't restrict the type inside a nested function:
            # https://mypy.readthedocs.io/en/stable/common_issues.html#narrowing-and-inner-functions
            assert rm.id
            return self.async_runner(self._api.get_model_versions(rm.id, options))

        return Pager[ModelVersion](rm_versions)



[docs]
    def save_to_s3(
        self,
        path: str,
        bucket_name: str,
        s3_prefix: str,
        *,
        endpoint_url: str | None = None,
        access_key_id: str | None = None,
        secret_access_key: str | None = None,
        region: str | None = None,
        multipart_threshold: int = 1024 * 1024,
        multipart_chunksize: int = 1024 * 1024,
        max_pool_connections: int = 10,
    ) -> str:
        """Saves a model to an S3 compatible storage.

        Args:
            path: Location to where the model(s) or artifact(s) are located. \
                Can recursively upload nested files in folders.
            bucket_name: The bucket to use for the S3 compatible object storage.
            s3_prefix: The path to prefix under root of bucket.

        Keyword Args:
            endpoint_url: The endpoint URL for the S3 comaptible storage if not using AWS S3.
            access_key_id: The S3 compatible object storage access ID.
            secret_access_key: The S3 compatible object storage secret access key.
            region: The region name for the S3 object storage.
            multipart_threshold: The threshold for multipart uploads.
            multipart_chunksize: The size of chunks for multipart uploads.
            max_pool_connections: The maximum number of connections in the pool.

        Returns:
            The S3 URI to the uploaded files.

        Raises:
            StoreError: If there was an issue uploading to S3.
        """
        # Get mixed credentials
        endpoint_url, access_key_id, secret_access_key, region = _s3_creds(
            endpoint_url, access_key_id, secret_access_key, region
        )

        s3, transfer_config = _connect_to_s3(
            endpoint_url=endpoint_url,
            access_key_id=access_key_id,
            secret_access_key=secret_access_key,
            multipart_threshold=multipart_threshold,
            multipart_chunksize=multipart_chunksize,
            max_pool_connections=max_pool_connections,
        )
        return _upload_to_s3(
            path=path,
            path_prefix=s3_prefix,
            bucket=bucket_name,
            s3=s3,
            endpoint_url=endpoint_url,
            region=region,
            transfer_config=transfer_config,
        )



[docs]
    def start_experiment_run(
        self,
        experiment_name: str | None = None,
        experiment_id: str | None = None,
        run_name: str | None = None,
        run_id: str | None = None,
        *,
        owner: str | None = None,
        description: str | None = None,
        run_description: str | None = None,
        nested: bool = False,
        nested_tag: str | None = "kubeflow.parent_run_id",
    ) -> ActiveExperimentRun:
        """Start an experiment run.

        Args:
            experiment_name: Name of the experiment.
            experiment_id: ID of the experiment.
            run_name: Name of the run.
            run_id: ID of the run.

        Keyword Args:
            owner: Owner of the experiment.
            description: Description of the experiment.
            run_description: Description of the run.
            nested: Whether the run is nested.
            nested_tag: Tag to use for nested runs.

        Returns:
            Experiment run.
        """
        active_ctx = self._get_active_context()
        self._validate_nested_run(active_ctx, nested)

        # Resolve experiment details
        exp_name, exp_id = self._resolve_experiment_info(experiment_name, experiment_id, active_ctx, nested)

        # Get or create experiment
        experiment = self._get_or_create_experiment(exp_name, exp_id, owner, description)

        # Get or create run
        parent_props = self._get_parent_properties(active_ctx, nested_tag) if nested else {}
        exp_run = self._get_or_create_run(experiment, run_name, run_id, run_description, parent_props, nested)

        # Update context if not nested
        if not active_ctx.active:
            self._set_active_context(experiment.id, exp_name, exp_run.id)

        return ActiveExperimentRun(
            thread_safe_ctx=self._active_experiment_context,
            experiment_run=exp_run,
            api=self._api,
            async_runner=self.async_runner,
        )


    def _get_active_context(self) -> RunContext:
        """Get the current active experiment context."""
        return self._active_experiment_context.get()

    def _validate_nested_run(self, active_ctx: RunContext, nested: bool) -> None:
        """Validate nested run configuration."""
        if active_ctx.active and not nested:
            msg = "Experiment run is already active. Please set nested=True to start a nested run."
            raise ValueError(msg)

    def _resolve_experiment_info(
        self,
        exp_name: str | None,
        exp_id: str | None,
        active_ctx: RunContext,
        nested: bool,
    ) -> tuple[str | None, str | None]:
        """Resolve experiment name and ID from inputs or context."""
        # Use provided values or inherit from active context
        exp_name = exp_name or active_ctx.name
        exp_id = exp_id or active_ctx.id

        # Generate name if nothing provided and not nested
        if not any([exp_name, exp_id, nested]):
            exp_name = generate_name("experiment")

        return exp_name, exp_id

    def _get_or_create_experiment(
        self,
        exp_name: str | None,
        exp_id: str | None,
        owner: str | None,
        description: str | None,
    ) -> Experiment:
        """Get existing experiment or create new one."""
        # Try to get existing experiment
        if exp_name:
            exp = self.async_runner(self._api.get_experiment_by_name(exp_name))
        elif exp_id:
            exp = self.async_runner(self._api.get_experiment_by_id(exp_id))
        else:
            msg = "Either experiment_name or experiment_id must be provided"
            raise ValueError(msg)

        # Create if doesn't exist
        if not exp:
            exp = self.async_runner(
                self._api.upsert_experiment(
                    Experiment(
                        name=exp_name,
                        owner=owner,
                        description=description,
                    )
                )
            )
            print(f"Experiment {exp_name} created with ID: {exp.id}")

        return exp

    def _get_parent_properties(self, active_ctx: RunContext, nested_tag: str) -> dict:
        """Get parent run properties for nested runs."""
        return {nested_tag: active_ctx.run_id} if active_ctx.active else {}

    def _get_or_create_run(
        self,
        experiment: Experiment,
        run_name: str | None,
        run_id: str | None,
        run_description: str | None,
        parent_props: dict,
        nested: bool,
    ) -> ExperimentRun:
        """Get existing run or create new one."""
        exp_run_args = {
            "experiment_name": experiment.name,
            "experiment_id": experiment.id,
        }

        # Try to get existing run
        if run_name:
            exp_run = self.async_runner(
                self._api.get_experiment_run_by_experiment_and_run_name(
                    run_id=run_id,
                    **exp_run_args,
                )
            )
        elif run_id:
            exp_run = self.async_runner(
                self._api.get_experiment_run_by_experiment_and_run_id(
                    run_id=run_id,
                    **exp_run_args,
                )
            )
        else:
            # Create new run
            exp_run = self.async_runner(
                self._api.upsert_experiment_run(
                    ExperimentRun(
                        experiment_id=experiment.id,
                        name=generate_name("run"),
                        description=run_description,
                        custom_properties=parent_props,
                    )
                )
            )
            prefix = "Nested " if nested else ""
            print(f"{prefix}Experiment Run {exp_run.name} created with ID: {exp_run.id}")

        return exp_run

    def _set_active_context(self, exp_id: str, exp_name: str, run_id: str) -> None:
        """Set the active experiment context."""
        new_ctx = RunContext(id=exp_id, name=exp_name, run_id=run_id, active=True)
        self._active_experiment_context.set(new_ctx)


[docs]
    def create_experiment(self, name: str) -> Experiment:
        """Create an experiment.

        Args:
            name: Name of the experiment.
        """
        return self.async_runner(self._api.upsert_experiment(Experiment(name=name)))



[docs]
    def get_experiment_run(self, run_id: str) -> ExperimentRun:
        """Get an experiment run.

        Args:
            run_id: ID of the experiment run.
        """
        return self.async_runner(self._api.get_experiment_run_by_id(run_id))



[docs]
    def get_experiments(self) -> Pager[Experiment]:
        """Get a pager for experiments.

        Returns:
            Iterable pager for experiments.
        """

        def exp_list(options: ListOptions) -> list[Experiment]:
            return self.async_runner(self._api.get_experiments(options))

        return Pager[Experiment](exp_list)


    @overload
    def get_experiment_runs(self, experiment_id: str) -> Pager[ExperimentRun]: ...

    @overload
    def get_experiment_runs(self, experiment_name: str) -> Pager[ExperimentRun]: ...


[docs]
    @required_args(("experiment_id",), ("experiment_name",))
    def get_experiment_runs(
        self, experiment_id: str | None = None, experiment_name: str | None = None
    ) -> Pager[ExperimentRun]:
        """Get a pager for experiment runs.

        Returns:
            Iterable pager for experiment runs.
        """

        def exp_run_list(options: ListOptions) -> list[ExperimentRun]:
            if experiment_id:
                return self.async_runner(self._api.get_experiment_runs_by_experiment_id(experiment_id, options))
            return self.async_runner(self._api.get_experiment_runs_by_experiment_name(experiment_name, options))

        return Pager[ExperimentRun](exp_run_list)


    @overload
    def get_experiment_run_logs(
        self,
        run_id: str,
    ) -> Pager[ExperimentRunArtifact]: ...

    @overload
    def get_experiment_run_logs(
        self,
        run_name: str,
        experiment_name: str,
    ) -> Pager[ExperimentRunArtifact]: ...

    @overload
    def get_experiment_run_logs(
        self,
        run_name: str,
        experiment_id: str,
    ) -> Pager[ExperimentRunArtifact]: ...


[docs]
    @required_args(
        ("run_id",),
        (
            "run_name",
            "experiment_name",
        ),
        (
            "run_name",
            "experiment_id",
        ),
    )
    def get_experiment_run_logs(
        self,
        run_id: str | None = None,
        run_name: str | None = None,
        experiment_id: str | None = None,
        experiment_name: str | None = None,
    ) -> Pager[ExperimentRunArtifact]:
        """Get a pager for experiment run logs.

        Args:
            run_id: ID of the experiment run.
            run_name: Name of the experiment run.
            experiment_id: ID of the experiment.
            experiment_name: Name of the experiment.

        Returns:
            Iterable pager for experiment run logs.
        """

        def exp_run_logs(options: ListOptions) -> list[ExperimentRunArtifact]:
            if run_id:
                return self.async_runner(
                    self._api.get_artifacts_by_experiment_run_params(run_id=run_id, options=options)
                )
            if run_name and experiment_name:
                return self.async_runner(
                    self._api.get_artifacts_by_experiment_run_params(
                        run_name=run_name,
                        experiment_name=experiment_name,
                        options=options,
                    )
                )
            if run_name and experiment_id:
                return self.async_runner(
                    self._api.get_artifacts_by_experiment_run_params(experiment_id=experiment_id, options=options)
                )
            return None

        return Pager[ExperimentRunArtifact](exp_run_logs)



    # TODO: consider porting get_artifacts method here
    # https://github.com/kubeflow/model-registry/pull/1536