Engine for ML/Data tracking, visualization, dashboards, and model UI for Polyaxon.

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Project description

traceml

TraceML

Engine for ML/Data tracking, visualization, and dashboards for Polyaxon.

Install

pip install traceml

If you would like to use the tracking features, you need to install polyaxon as well:

pip install polyaxon traceml

Local sandbox

WIP: this command is in preview

Start a local sandbox to track and visualize the run

polyaxon sandbox -f path/to/artifacts/repo

Offline usage

You can enable the offline mode to track runs without an API:

export POLYAXON_OFFLINE="true"

Or passing the offline flag

from traceml import tracking

tracking.init(..., is_offline=True, ...)

Simple usage in a Python script

import random

import traceml as tracking

tracking.init(
    is_offline=True,
    project='quick-start',
    name="my-new-run",
    description="trying TraceML",
    tags=["examples"],
    artifacts_path="path/to/artifacts/repo"
) 

# Tracking some data refs
tracking.log_data_ref(content=X_train, name='x_train')
tracking.log_data_ref(content=y_train, name='y_train')

# Tracking inputs
tracking.log_inputs(
    batch_size=64,
    dropout=0.2,
    learning_rate=0.001,
    optimizer="Adam"
)

def get_loss(step):
    result = 10 / (step + 1)
    noise = (random.random() - 0.5) * 0.5 * result
    return result + noise

# Track metrics
for step in range(100):
    loss = get_loss(step)
    tracking.log_metrics(
    loss=loss,
    accuracy=(100 - loss) / 100.0,
)

# Track some one time results
tracking.log_outputs(validation_score=0.66)

# Optionally manually stop the tracking process
tracking.stop()

Integration with deep learning and machine learning libraries and frameworks

Keras

You can use TraceML's callback to automatically save all metrics and collect outputs and models, you can also track additional information using the logging methods:

from traceml import tracking
from traceml.integrations.keras import Callback

tracking.init(
    is_offline=True,
    project='tracking-project',
    name="keras-run",
    description="trying TraceML & Keras",
    tags=["examples"],
    artifacts_path="path/to/artifacts/repo"
)

tracking.log_inputs(
    batch_size=64,
    dropout=0.2,
    learning_rate=0.001,
    optimizer="Adam"
)
tracking.log_data_ref(content=x_train, name='x_train')
tracking.log_data_ref(content=y_train, name='y_train')
tracking.log_data_ref(content=x_test, name='x_test')
tracking.log_data_ref(content=y_test, name='y_test')

# ...

model.fit(
    x_train,
    y_train,
    validation_data=(X_test, y_test),
    epochs=epochs,
    batch_size=100,
    callbacks=[Callback()],
)

PyTorch

You can log metrics, inputs, and outputs of Pytorch experiments using the tracking module:

from traceml import tracking

tracking.init(
    is_offline=True,
    project='tracking-project',
    name="pytorch-run",
    description="trying TraceML & PyTorch",
    tags=["examples"],
    artifacts_path="path/to/artifacts/repo"
)

tracking.log_inputs(
    batch_size=64,
    dropout=0.2,
    learning_rate=0.001,
    optimizer="Adam"
)

# Metrics
for batch_idx, (data, target) in enumerate(train_loader):
    output = model(data)
    loss = F.nll_loss(output, target)
    loss.backward()
    optimizer.step()
    tracking.log_mtrics(loss=loss)
    
asset_path = tracking.get_outputs_path('model.ckpt')
torch.save(model.state_dict(), asset_path)

# log model
tracking.log_artifact_ref(asset_path, framework="pytorch", ...)

Tensorflow

You can log metrics, outputs, and models of Tensorflow experiments and distributed Tensorflow experiments using the tracking module:

from traceml import tracking
from traceml.integrations.tensorflow import Callback

tracking.init(
    is_offline=True,
    project='tracking-project',
    name="tf-run",
    description="trying TraceML & Tensorflow",
    tags=["examples"],
    artifacts_path="path/to/artifacts/repo"
)

tracking.log_inputs(
    batch_size=64,
    dropout=0.2,
    learning_rate=0.001,
    optimizer="Adam"
)

# log model
estimator.train(hooks=[Callback(log_image=True, log_histo=True, log_tensor=True)])

Fastai

You can log metrics, outputs, and models of Fastai experiments using the tracking module:

from traceml import tracking
from traceml.integrations.fastai import Callback

tracking.init(
    is_offline=True,
    project='tracking-project',
    name="fastai-run",
    description="trying TraceML & Fastai",
    tags=["examples"],
    artifacts_path="path/to/artifacts/repo"
)

# Log model metrics
learn.fit(..., cbs=[Callback()])

Pytorch Lightning

You can log metrics, outputs, and models of Pytorch Lightning experiments using the tracking module:

from traceml import tracking
from traceml.integrations.pytorch_lightning import Callback

tracking.init(
    is_offline=True,
    project='tracking-project',
    name="pytorch-lightning-run",
    description="trying TraceML & Lightning",
    tags=["examples"],
    artifacts_path="path/to/artifacts/repo"
)

...
trainer = pl.Trainer(
    gpus=0,
    progress_bar_refresh_rate=20,
    max_epochs=2,
    logger=Callback(),
)

HuggingFace

You can log metrics, outputs, and models of HuggingFace experiments using the tracking module:

from traceml import tracking
from traceml.integrations.hugging_face import Callback

tracking.init(
    is_offline=True,
    project='tracking-project',
    name="hg-run",
    description="trying TraceML & HuggingFace",
    tags=["examples"],
    artifacts_path="path/to/artifacts/repo"
)

...
trainer = Trainer(
    model=model,
    args=training_args,
    train_dataset=train_dataset if training_args.do_train else None,
    eval_dataset=eval_dataset if training_args.do_eval else None,
    callbacks=[Callback],
    # ...
)

Tracking artifacts

import altair as alt
import matplotlib.pyplot as plt
import numpy as np
import plotly.express as px
from bokeh.plotting import figure
from vega_datasets import data

from traceml import tracking


def plot_mpl_figure(step):
    np.random.seed(19680801)
    data = np.random.randn(2, 100)

    figure, axs = plt.subplots(2, 2, figsize=(5, 5))
    axs[0, 0].hist(data[0])
    axs[1, 0].scatter(data[0], data[1])
    axs[0, 1].plot(data[0], data[1])
    axs[1, 1].hist2d(data[0], data[1])

    tracking.log_mpl_image(figure, 'mpl_image', step=step)


def log_bokeh(step):
    factors = ["a", "b", "c", "d", "e", "f", "g", "h"]
    x = [50, 40, 65, 10, 25, 37, 80, 60]

    dot = figure(title="Categorical Dot Plot", tools="", toolbar_location=None,
                 y_range=factors, x_range=[0, 100])

    dot.segment(0, factors, x, factors, line_width=2, line_color="green", )
    dot.circle(x, factors, size=15, fill_color="orange", line_color="green", line_width=3, )

    factors = ["foo 123", "bar:0.2", "baz-10"]
    x = ["foo 123", "foo 123", "foo 123", "bar:0.2", "bar:0.2", "bar:0.2", "baz-10", "baz-10",
         "baz-10"]
    y = ["foo 123", "bar:0.2", "baz-10", "foo 123", "bar:0.2", "baz-10", "foo 123", "bar:0.2",
         "baz-10"]
    colors = [
        "#0B486B", "#79BD9A", "#CFF09E",
        "#79BD9A", "#0B486B", "#79BD9A",
        "#CFF09E", "#79BD9A", "#0B486B"
    ]

    hm = figure(title="Categorical Heatmap", tools="hover", toolbar_location=None,
                x_range=factors, y_range=factors)

    hm.rect(x, y, color=colors, width=1, height=1)

    tracking.log_bokeh_chart(name='confusion-bokeh', figure=hm, step=step)


def log_altair(step):
    source = data.cars()

    brush = alt.selection(type='interval')

    points = alt.Chart(source).mark_point().encode(
        x='Horsepower:Q',
        y='Miles_per_Gallon:Q',
        color=alt.condition(brush, 'Origin:N', alt.value('lightgray'))
    ).add_selection(
        brush
    )

    bars = alt.Chart(source).mark_bar().encode(
        y='Origin:N',
        color='Origin:N',
        x='count(Origin):Q'
    ).transform_filter(
        brush
    )

    chart = points & bars

    tracking.log_altair_chart(name='altair_chart', figure=chart, step=step)


def log_plotly(step):
    df = px.data.tips()

    fig = px.density_heatmap(df, x="total_bill", y="tip", facet_row="sex", facet_col="smoker")
    tracking.log_plotly_chart(name="2d-hist", figure=fig, step=step)


plot_mpl_figure(100)
log_bokeh(100)
log_altair(100)
log_plotly(100)

Project details

These details have not been verified by PyPI

Project links

Homepage

GitHub Statistics

View statistics for this project via Libraries.io, or by using our public dataset on Google BigQuery

Release history Release notifications | RSS feed

2.0.0rc48 pre-release

Sep 25, 2023

2.0.0rc47 pre-release

Sep 25, 2023

2.0.0rc46 pre-release

Sep 21, 2023

2.0.0rc45 pre-release

Sep 21, 2023

2.0.0rc44 pre-release

Sep 20, 2023

2.0.0rc43 pre-release

Sep 20, 2023

2.0.0rc42 pre-release

Sep 20, 2023

2.0.0rc41 pre-release

Sep 12, 2023

2.0.0rc40 pre-release

Sep 12, 2023

1.1.4

Apr 11, 2024

1.1.3

Mar 31, 2024

1.1.2

Mar 31, 2024

1.1.1

Feb 29, 2024

1.1.0

Nov 2, 2023

1.1.0rc45 pre-release

Oct 24, 2023

1.1.0rc44 pre-release

Oct 21, 2023

1.1.0rc43 pre-release

Oct 17, 2023

1.1.0rc42 pre-release

Oct 12, 2023

1.1.0rc41 pre-release

Sep 29, 2023

1.1.0rc40 pre-release

Sep 27, 2023

1.1.0rc39 pre-release

Sep 8, 2023

1.1.0rc38 pre-release

Sep 3, 2023

1.1.0rc37 pre-release

Aug 24, 2023

1.1.0rc36 pre-release

Aug 14, 2023

1.1.0rc35 pre-release

Aug 11, 2023

1.1.0rc34 pre-release

Aug 11, 2023

1.1.0rc33 pre-release

Aug 10, 2023

1.1.0rc32 pre-release

Aug 10, 2023

1.1.0rc31 pre-release

Aug 9, 2023

1.1.0rc30 pre-release

Aug 6, 2023

1.1.0rc29 pre-release

Aug 6, 2023

1.1.0rc28 pre-release

Jul 27, 2023

1.1.0rc27 pre-release

Jul 27, 2023

1.1.0rc26 pre-release

Jul 2, 2023

1.1.0rc25 pre-release

Jun 30, 2023

1.1.0rc24 pre-release

Jun 28, 2023

1.1.0rc23 pre-release

Jun 27, 2023

1.1.0rc22 pre-release

Jun 24, 2023

1.1.0rc21 pre-release

Jun 21, 2023

1.1.0rc20 pre-release

Jun 20, 2023

1.1.0rc19 pre-release

Jun 15, 2023

1.1.0rc18 pre-release

Jun 9, 2023

1.1.0rc17 pre-release

Jun 5, 2023

1.1.0rc16 pre-release

May 21, 2023

1.1.0rc15 pre-release

May 20, 2023

1.1.0rc14 pre-release

May 11, 2023

1.1.0rc13 pre-release

May 1, 2023

1.1.0rc12 pre-release

Apr 23, 2023

1.1.0rc11 pre-release

Apr 22, 2023

1.1.0rc10 pre-release

Apr 21, 2023

1.1.0rc9 pre-release

Apr 18, 2023

1.1.0rc8 pre-release

Apr 16, 2023

1.1.0rc7 pre-release

Apr 12, 2023

1.1.0rc6 pre-release

Apr 11, 2023

1.1.0rc5 pre-release

Apr 11, 2023

1.1.0rc4 pre-release

Apr 10, 2023

1.1.0rc3 pre-release

Apr 10, 2023

1.1.0rc2 pre-release

Apr 9, 2023

1.1.0rc1 pre-release

Apr 9, 2023

1.1.0rc0 pre-release

Apr 7, 2023

1.0.8

Feb 1, 2023

1.0.7

Jan 18, 2023

1.0.6

Jan 16, 2023

1.0.5

Jan 15, 2023

1.0.4

Jan 12, 2023

1.0.4rc2 pre-release

Nov 23, 2022

1.0.4rc1 pre-release

Nov 19, 2022

1.0.4rc0 pre-release

Nov 19, 2022

1.0.3

Aug 14, 2022

1.0.2

Jul 24, 2022

1.0.2rc0 pre-release

Jul 16, 2022

1.0.1

Jun 29, 2022

1.0.0

May 22, 2022

1.0.0rc8 pre-release

May 22, 2022

1.0.0rc7 pre-release

May 19, 2022

This version

1.0.0rc6 pre-release

May 16, 2022

1.0.0rc5 pre-release

May 4, 2022

1.0.0rc4 pre-release

Apr 27, 2022

1.0.0rc3 pre-release

Apr 18, 2022

1.0.0rc2 pre-release

Apr 18, 2022

1.0.0rc1 pre-release

Apr 12, 2022

1.0.0rc0 pre-release

Apr 12, 2022

0.0.0

Dec 7, 2021

Download files

Download the file for your platform. If you're not sure which to choose, learn more about installing packages.

Source Distribution

traceml-1.0.0rc6.tar.gz (87.4 kB view hashes)

Uploaded May 16, 2022 Source

Built Distribution

traceml-1.0.0rc6-py3-none-any.whl (127.1 kB view hashes)

Uploaded May 16, 2022 Python 3

Hashes for traceml-1.0.0rc6.tar.gz

Hashes for traceml-1.0.0rc6.tar.gz
Algorithm	Hash digest
SHA256	`51084707160f336ea5bc8e8ae7fb987001800a379b98d121f79ffb2f404452cf`
MD5	`b4cc3b484c2a57a2cfb56e3f061c9c56`
BLAKE2b-256	`57f2f629872052522bfd2fdb6f768a8983dad33d2a1d2d10f5cecd2511e69f37`

Hashes for traceml-1.0.0rc6-py3-none-any.whl

Hashes for traceml-1.0.0rc6-py3-none-any.whl
Algorithm	Hash digest
SHA256	`7726f9f43f172824a6d47af2f7642568b9eaa742c385159399538afa9bf9ccc3`
MD5	`a26f18652d8403ce3a63f1c036b4a91b`
BLAKE2b-256	`cc039e5db4890224de0c3e4bffe867c22043ac6d569d9fb8ca749ed61d1dff72`