經營與管理數據倉儲令人傷神且耗時,尤其現在數據無處不在,更存在於我們的一言一行。調整系統規模以配合超高的數據成長,對維護日常的運作也成了日益艱鉅的挑戰。用最少的停機時間升級數據倉儲,並支援機器學習與人工智慧以滿足業務需求,更是繁瑣。企業選擇 Google Cloud 的 BigQuery -無伺服器的企業數據倉儲,是為了專心於分析並提高生產力,而不是管理基礎建設。
延伸閱讀:BigQuery 是什麼?與傳統倉儲不同,4 大優勢助你分析大數據資料!
一旦使用了 BigQuery,就可以用閃電般的速度進行查詢,透過串流取得即時的洞察,並開始使用先進的預測性分析。但這不表示您儲藏在 BigQuery 的數據沒有進一步的優化空間。在這雲端計算時代,成本是科技決策背後的主要動力之一,我們發現企業最在意自然是關於計價細節和如何持續優化成本。
因此我們歸納這份操作清單,協助企業用於優化 BigQuery 成本,不僅如何更可以進一步優化您的業務成果。在 BigQuery 中優化成本有一項好處,是因為其無伺服器的架構讓這些優化能產生更好的效能,您就不用為了成本跟效能妥協。
BigQuery 的基本訂價
首先我們先了解 BigQuery 的訂價,再接著再深入探討各子項的計價,為您的 BigQuery 費用提供秘訣。不管任何資料中心,BigQuery 的訂價分為二大項如下:
儲存
- 動態儲存月費(Active storage)
- 長期儲存月費(Long-term storage)
- 串流插入(Streaming inserts)
查詢處理
- 以量計價(On-demand)
- 固定費率(Flat-rate)
在我們進一步探討這些項目之前,以下為 BigQuery 作業在任何資料中心皆免費提供的項目:
- 批次載入(Batch loading data into BigQuery)
- 自動重新分組:無須設定與維護(Automatic re-clustering which requires no setup and maintenance)
- 匯出數據作業(Exporting data operation)
- 刪除表格、視圖、分隔、功能、數據組(Deleting table, views, partitions, functions and datasets )
- 元資料作業(Metadata operations)
- 暫存查詢(Cached queries)
- 導致錯誤的查詢(Queries that result in error)
- 每月前 10GB 儲存免費(Storage for first 10 GB of data per month)
- 每月前 1TB 查詢數據處理,對於選擇隨選訂價的使用者而言有(Query data processed for first 1 TB of data per month : advantageous to users on on-demand pricing)
節省 BigQuery 成本教學指南一:優化儲存流程
一旦數據載入 BigQuery,費用就會按照每秒儲存到表格的數據量計算。以下是提供優化您的 BigQuery 儲存成本的小秘訣。
1.數據組期限:只有在需要的時候保留數據
預設中,以 BigQuery 縱向存儲格式(Capacitor columnar data format)儲存的數據都已經加密並壓縮。若在數據組中,無須永久保留的臨時數據,可以設定表格期限時間。
例如在這個例子中,我們只須查詢臨時天氣數據組,直到下游作業清除數據並推送到生產數據組為止。這裡,我們可以設定預設表格到期日為七天。