Nedávno som začal pracovať na Databricks a ja som sa snažila nájsť spôsob, ako vykonať zlúčenie ziskov a strát na Delta tabuľky, keď používate R api (najlepšie sparklyr). Konečným cieľom je, aby sa nejako uložiť "duplikát", obmedzenia, ako je popísané tu. Vyššie uvedený dokumentácia popisuje: Python workflow :
deltaTable.alias("logs").merge(
newDedupedLogs.alias("newDedupedLogs"),
"logs.uniqueId = newDedupedLogs.uniqueId") \
.whenNotMatchedInsertAll() \
.execute()
avšak, bol som zvedavý, či tam je bezproblémová spôsob, ako tento cieľ dosiahnuť prostredníctvom R. Akúkoľvek pomoc/nápady na záležitosť bude veľmi ocenil, pretože som nový užívateľ (ako je uvedené vyššie). Vďaka vopred!