Not able to append records to table using df.write... - Cloudera Community

link管理

链接快照平台

相关文章推荐

博学的墨镜 · 如何使用云原生多模数据库Lindorm连接器 ...· 1 月前 ·

开朗的风衣 · 为什么我每天都会使用坚果云-Tuxera ...· 2 月前 ·

打篮球的香菜 · 11.1 为JPA中的列设置默认值｜ ...· 9 月前 ·

自信的小狗 · JAVA中两个Set比较找出交集、差集、并集 ...· 10 月前 ·

想发财的野马 · 失控玩家电影原声 - 歌单 - 网易云音乐· 1 年前 ·

I have the exact same problem.

Spark 2.2.0.cloudera1.

Can you please tell me what's wrong with this code?

It's the easiest Java version of the example code in Spark's Javadoc example ( here ).

The code:

List<Row> rows = new ArrayList<>();

Object[] cols = new Object[2]; cols[0] = "one" ; cols[1] = 1;

rows.add(RowFactory. create (cols));

spark.createDataFrame(rows, st).write().format( "parquet" ).mode(SaveMode. Overwrite ).saveAsTable( "my_scheme.my_table" );

rows = new ArrayList<>();

cols[0] = "two" ; cols[1] = 2;

rows.add(RowFactory. create (cols));

spark.createDataFrame(rows, st).write().format( "parquet" ).mode(SaveMode. Append ).saveAsTable( "my_scheme.my_table" );

The error:

java.lang.IllegalArgumentException: Expected exactly one path to be specified, but got:

at org.apache.spark.sql.execution.datasources.DataSource.writeInFileFormat(DataSource.scala:410)

at org.apache.spark.sql.execution.datasources.DataSource.writeAndRead(DataSource.scala:454)

at org.apache.spark.sql.execution.command.CreateDataSourceTableAsSelectCommand.saveDataIntoTable(createDataSourceTables.scala:198)

at org.apache.spark.sql.execution.command.CreateDataSourceTableAsSelectCommand.run(createDataSourceTables.scala:148)

at org.apache.spark.sql.execution.command.ExecutedCommandExec.sideEffectResult$lzycompute(commands.scala:58)

at org.apache.spark.sql.execution.command.ExecutedCommandExec.sideEffectResult(commands.scala:56)

at org.apache.spark.sql.execution.command.ExecutedCommandExec.doExecute(commands.scala:74)

at org.apache.spark.sql.execution.SparkPlan$$anonfun$execute$1.apply(SparkPlan.scala:117)

at org.apache.spark.sql.execution.SparkPlan$$anonfun$executeQuery$1.apply(SparkPlan.scala:138)

at org.apache.spark.rdd.RDDOperationScope$.withScope(RDDOperationScope.scala:151)

at org.apache.spark.sql.execution.SparkPlan.executeQuery(SparkPlan.scala:135)

at org.apache.spark.sql.execution.SparkPlan.execute(SparkPlan.scala:116)

at org.apache.spark.sql.execution.QueryExecution.toRdd$lzycompute(QueryExecution.scala:92)

at org.apache.spark.sql.execution.QueryExecution.toRdd(QueryExecution.scala:92)

at org.apache.spark.sql.DataFrameWriter.runCommand(DataFrameWriter.scala:610)

at org.apache.spark.sql.DataFrameWriter.createTable(DataFrameWriter.scala:420)

at org.apache.spark.sql.DataFrameWriter.saveAsTable(DataFrameWriter.scala:399)

at org.apache.spark.sql.DataFrameWriter.saveAsTable(DataFrameWriter.scala:354)

Apache Hadoop and associated open source project names are trademarks of the Apache Software Foundation. For a complete list of trademarks, click here.