Tengo el siguiente código usando Tensorflow Extended (TFX)

from tfx.utils.dsl_utils import csv_input
from tfx.components.example_gen.csv_example_gen.component import CsvExampleGen

examples = csv_input(os.path.join(base_dir, 'data/simple'))
example_gen = CsvExampleGen(input=examples);

Cuando ejecuto este código en Google Colab, funciona bien. Sin embargo, cuando ejecuto esto

Rastreo (última llamada más reciente):
archivo "tfx_sample.py", línea 4,
desde tfx.components.example_gen.csv_example_gen.component import CsvExampleGen
File "/Users/sv/tfx_env/lib/python3.7/site-packages/ tfx/components/init.py", línea 20,
desde tfx.components.bulk_inferrer.component import BulkInferrer
File "/Users/sv/tfx_env/lib/python3.7/site-packages/tfx/components/bulk_inferrer/component. py",
línea 24,
desde tfx.components.base import base_component
File "/Users/sv/tfx_env/lib/python3.7/site-packages/tfx/components/base/base_component.py", línea 28,
desde tfx.components.base import
archivo base_driver "/Users/sv/tfx_env/lib/python3.7/site-packages/tfx/components/base/base_driver.py",línea 28, en
from tfx.orchestration import metadata
File "/Users/sv/tfx_env/lib/python3.7/site-packages/tfx/orchestration/metadata.py", línea 36, ​​in from ml_metadata.metadata_store import metadata_store
File "/usr/local /lib/python3.7/site-packages/ml_metadata/metadata_store/init.py", línea 15, desde ml_metadata.metadata_store.metadata_store import MetadataStore
File "/usr/local/lib/python3.7/site-packages/ml_metadata /metadata_store/metadata_store.py", línea 32, en from ml_metadata.metadata_store import pywrap_tf_metadata_store_serialized as metadata_store_serialized
File "/usr/local/lib/python3.7/site-packages/ml_metadata/metadata_store/pywrap_tf_metadata_store_serialized.py", línea 28, en _pywrap_tf_metadata_store_serialized = swig_import_helper()
Archivo "/usr/local/lib/python3.7/site-packages/ml_metadata/metadata_store/pywrap_tf_metadata_store_serialized.py", línea 24, en swig_import_helper _mod = imp.load_module('_pywrap_tf_metadata_store_serialized', fp, nombre de ruta, descripción)
Archivo "/ usr/local/Cellar/python/3.7.7/Frameworks/Python.framework/Versions/3.7/lib/python3.7/imp.py", línea 242, en load_module return load_dynamic(nombre, nombre de archivo, archivo)
Archivo "/ usr/local/Cellar/python/3.7.7/Frameworks/Python.framework/Versions/3.7/lib/python3.7/imp.py", línea 342, en load_dynamic return _load(spec)
ImportError: dlopen(/usr/ local/lib/python3.7/site-packages/ml_metadata/metadata_store/_pywrap_tf_metadata_store_serialized.so, 2): Símbolo no encontrado: ____chkstk_darwin
Referenciado desde: /usr/local/lib/python3.7/site-packages/ml_metadata/metadata_store/_pywrap_tf_metadata_store_serialized.so (que fue construido para Mac OS X 10.15)
Esperado en: /usr/lib/libSystem.B.dylib en / usr/local/lib/python3.7/site-packages/ml_metadata/metadata_store/_pywrap_tf_metadata_store_serialized.so

Aquí están los detalles de la versión de los paquetes instalados.

apache-beam 2.20.0
tensorboard 1.15.0
tensorboard-plugin-wit 1.6.0.post3
tensorflow 1.15.0
tensorflow-data-validation 0.23.0.dev0
tensorflow-estimator 1.15.1
tensorflow-metadata 0.22.0
tensorflow-model- análisis 0.21.5
tensorflow-serving-api 2.1.0
tensorflow-transform 0.22.0
tfx 0.21.4
tfx-bsl 0.22.0

respuesta

Utilice la última versión (0.29.0) disponible para tfx. Código de trabajo para resolver el problema: -

import os
import tfx
from tfx.utils.dsl_utils import external_input
from tfx.components.example_gen.csv_example_gen.component import CsvExampleGen
import tempfile
import urllib

_data_root = tempfile.mkdtemp(prefix='tfx-data')
DATA_PATH = 'https://raw.githubusercontent.com/tensorflow/tfx/master/tfx/examples/chicago_taxi_pipeline/data/simple/data.csv'
_data_filepath = os.path.join(_data_root, "data.csv")
urllib.request.urlretrieve(DATA_PATH, _data_filepath)

example_gen = CsvExampleGen(input_base=(_data_filepath))