Embedding Studio

Home
Overview
Challenges & Solutions
Challenges & Solutions
- Challenges
- Solutions
  Solutions
Use Cases
Use Cases
- When is EmbeddingStudio the Best Fit?
  When is EmbeddingStudio the Best Fit?
  - Ideal scenarios 🎯
  - Optimal Moments 🚀
  - Examples 💼
    Examples 💼
    
    Online-store
    
    Legal firm
API
API
- Ping
- Public
  Public
  - Similarity Search
    Similarity Search
    
    Methods
    
    About Payload
    About Payload
    
    Overview
    
    How to Construct
    
    Usage for PostgreSQL
  - Query Parsing
  - Suggesting Service
  - Clickstream
    Clickstream
    
    Management
    
    Usage
  - Fine-Tuning
  - Data Management
    Data Management
    
    Upsert
    
    Delete
- Internal
  Internal
  - Model Management
  - Vector DB Management
  - Data Management
    Data Management
    
    Upsert
    
    Delete
    
    Reindex
Tutorials
Tutorials
- Getting Started
- Basic
  Basic
- Advanced
  Advanced
  - Data Management
    Data Management
    
    Clickstream
    
    Items
    
    Categories
    
    API
  - About Vector DB
    About Vector DB
    
    Integration
    
    Configuring
    
    Managing
  - Suggestions
    Suggestions
    
    Overview
    
    Management API
    
    Configuring Redis
  - Query Parsing
    Query Parsing
    
    Overview
    
    Customizing Selector
  - Vector Improvement & Personalization
    Vector Improvement & Personalization
    
    Overview
    
    Configuring
- Plugins
  Plugins
Documentation
Documentation
- api
  api
  - api_v1
    api_v1
    
    endpoints
    endpoints
    
    clickstream_client
    
    clickstream_internal
    
    delete
    
    fine_tuning
    
    ping
    
    query_parsing
    
    similarity_search
    
    suggesting
    
    upsert
    
    internal_api
    
    internal_endpoints
    internal_endpoints
    
    delete
    
    inference_deployment_tasks
    
    reindex
    
    upsert
    
    vectordb
    
    mocked_api
    
    mocked_endpoints
    mocked_endpoints
    
    mocked_fine_tuning
- clickstream_storage
  clickstream_storage
  - converters
    converters
    
    converter
  - query_retriever
  - search_event
  - text_query_retriever
- core
  core
  - plugin
- data_access
  data_access
  - clickstream
  - model_stage_tasks
  - model_transfer_tasks
  - mongo
    mongo
    
    clickstream
    
    crud_base
    
    mongo_dao
- data_storage
  data_storage
  - loaders
    loaders
    
    aggregated_data_loader
    
    cloud_storage
    cloud_storage
    
    bucket_file_meta
    
    gcp
    gcp
    
    gcp_image_loader
    
    gcp_json_loader
    
    gcp_loader
    
    gcp_text_loader
    
    s3
    s3
    
    s3_image_loader
    
    s3_json_loader
    
    s3_loader
    
    s3_text_loader
    
    data_loader
    
    item_meta
    
    sql
    sql
    
    pgsql
    pgsql
    
    pgsql_image_loader
    
    pgsql_jsonb_loader
    
    pgsql_loader
    
    pgsql_multi_text_column_loader
    
    pgsql_text_loader
    
    query_generator
    
    sql_item_meta
- db
  db
  - mongo
- embeddings
  embeddings
  - augmentations
    augmentations
    
    augmentation_interface
    
    augmentation_with_random_selection
    
    clickstream_augmentation_applier
    
    compose
    
    items_set_augmentation_applier
    
    text
    text
    
    cases
    
    misspellings
  - data
    data
    
    clickstream
    clickstream
    
    paired_fine_tuning_inputs
    
    train_test_splitter
    
    items
    items
    
    items_set
    
    manager
    
    preprocessors
    preprocessors
    
    dict_items_preprocessor
    
    image_items_preprocessor
    
    preprocessor
    
    text_items_preprocessor
    
    transforms
    transforms
    
    dict
    dict
    
    line_from_dict
    
    transforms
    
    image
    image
    
    center_padded
    
    clip_original
    
    transforms
    
    text
    text
    
    dummy
    
    transforms
  - features
    features
    
    event_confidences
    
    extractor
    
    fine_tuning_features
    
    fine_tuning_input
    
    ranks_aggregators
    ranks_aggregators
    
    max_aggregator
    
    mean_aggregator
    
    min_aggregator
    
    ranks_aggregator
  - improvement
    improvement
    
    torch_based_adjuster
    
    vectors_adjuster
  - inference
    inference
    
    triton
    triton
    
    client
    
    text_to_image
    text_to_image
    
    clip
    
    text_to_text
    text_to_text
    
    bert
    
    e5
  - losses
    losses
    
    prob_margin_ranking_loss
  - metrics
    metrics
    
    distance_shift
  - models
    models
    
    interface
    
    text_to_image
    text_to_image
    
    clip
    
    text_to_text
    text_to_text
    
    bert
    
    e5
    
    utils
    utils
    
    average_pool
    
    differentiable_extreme
    
    differentiable_mean
    
    pooler_output
    
    soft_indicator
  - selectors
    selectors
    
    dist_based_selector
    
    prob_dist_based_selector
    
    selector
    
    vectors_based_selector
  - splitters
    splitters
    
    dataset_splitter
    
    text
    text
    
    tokenized_grouped_splitter
  - training
    training
    
    embeddings_finetuner
- experiments
  experiments
- inference_management
  inference_management
  - triton
    triton
    
    jit_trace_manager
    
    manager
    
    model_storage_info
    
    pytorch_manager
    
    utils
    utils
    
    generate_model_file
    
    types_mapping
- models
  models
  - plugin
  - reindex
  - suggesting
  - utils
- suggesting
  suggesting
  - abstract_suggester
  - abtract_phrase_manager
  - redis
    redis
    
    complex_redis_suggester
    
    phrases_manager
    
    suggester
  - tokenizer
- tests
  tests
  - conftest
  - pytest_plugins
    pytest_plugins
    
    env_vars
  - test_fine_tuning
  - test_ping
- utils
  utils
  - datetime_utils
  - dramatiq_middlewares
  - dramatiq_task_handler
  - gpu_monitoring
  - initializer_actions
  - misspelling
    misspelling
    
    misspellers
  - mlflow_utils
  - model_download
  - plugin_utils
  - redis_utils
  - retry
  - string_utils
  - tasks
- vectordb
  vectordb
  - collection
  - collection_base
  - collection_info_cache
  - pgvector
    pgvector
    
    collection
    
    db_model
    
    functions
    functions
    
    advanced_similarity
    
    simple_similarity
    
    where_combinations
    
    optimization
    
    query_to_sql
    
    vectordb
  - vectordb
- workers
  workers
  - fine_tuning
    fine_tuning
    
    finetune_embedding
    
    finetune_embedding_one_param
    
    mocked_worker
    
    prepare_data
    
    worker
  - improvement
    improvement
    
    utils
    utils
    
    handle_improvement
    
    worker
  - inference
    inference
    
    utils
    utils
    
    deletion
    
    deployment deployment
    Table of contents
    
    Documentation for handle_deployment
    
    Functionality
    
    Parameters
    
    Usage
    
    Example
    
    file_locks
    
    init_model_repo
    
    prepare_for_triton
    
    worker
  - upsertion
    upsertion
    
    handlers
    handlers
    
    delete
    
    reindex
    
    reindex_subtask
    
    upsert
    
    utils
    utils
    
    deployment
    
    reindex
    
    upsert
    
    upsertion_stages
    
    worker

deployment

Documentation for `handle_deployment`¶

Functionality¶

The handle_deployment method manages the deployment of embedding models to the Triton Inference Server. It retrieves a deployment task, validates the model and its corresponding plugin, verifies the model's existence and compliance with supported plugins, enforces deployment limits, downloads the model's iteration from MLflow, converts it for Triton compatibility, and deploys it while utilizing file locking to prevent concurrent deployments.

Parameters¶

task_id: A string representing the deployment task ID.

Usage¶

Purpose: Automate the complete workflow for deploying an embedding model to Triton Inference Server safely and efficiently.

Example¶

handle_deployment("your_task_id")