
数据表示设计模式
|
55
TensorFlow Hub
加载到
BigQuery
。完整的代码位于
GitHub
(
https://github.com/
GoogleCloudPlatform/ml-design-patterns/blob/master/02_data_representation/text_
embeddings.ipynb
):
CREATE OR REPLACE MODEL advdata.swivel_text_embed
OPTIONS(model_type='tensorflow', model_path='gs://BUCKET/swivel/*')
然后,使用该模型将自然语言文本列转换为嵌入数组,并将嵌入查找存储到一个新
表中:
CREATE OR REPLACE TABLE advdata.comments_embedding AS
SELECT
output_0 as comments_embedding,
comments
FROM ML.PREDICT(MODEL advdata.swivel_text_embed,(
SELECT comments, LOWER(comments) AS sentences
FROM `bigquery-public-data.noaa_preliminary_severe_storms.wind_reports`
))
现在可以加入该表以获取任何注释的文本嵌入。对于图像嵌入,我们可以类似地将
图像
URL
转换为嵌入并将它们加载到数据仓库中。 ...