Loading data from TD#
input_table が大きい場合のサンプリング#
input_table が sampling_threshold
オプションに指定した件数よりも大きい場合、 sampling_threshold
の値近くの数だけサンプリングが行われる。
カラムごとの型の判定#
with pd.option_context('display.max_rows', 100, 'display.max_columns', 50):
display(df.infer_objects().dtypes)
customerid object
gender object
seniorcitizen int64
partner object
dependents object
tenure int64
phoneservice object
multiplelines object
internetservice object
onlinesecurity object
onlinebackup object
deviceprotection object
techsupport object
streamingtv object
streamingmovies object
contract object
paperlessbilling object
paymentmethod object
monthlycharges float64
totalcharges object
churn object
dtype: object
後ほど、Training Step で適切な型に変換される。