Merge pull request #89 from Stability-AI/dango.patch.atten_overflow

* Force cast to fp32 to avoid atten layer overflow
2024-12-22 15:44:58 +00:00 · 2022-12-07 14:54:35 +01:00 · 2022-12-07 14:54:35 +01:00 · 8bde0cf64f
commit 8bde0cf64f
parent f547c4acc8 e1797ae248
1 changed files with 12 additions and 2 deletions
--- a/ldm/modules/attention.py
+++ b/ldm/modules/attention.py
@ -16,6 +16,9 @@ try:
 except:
    XFORMERS_IS_AVAILBLE = False
 # CrossAttn precision handling
 import os
 _ATTN_PRECISION = os.environ.get("ATTN_PRECISION", "fp32")
 def exists(val):
    return val is not None
@ -167,9 +170,16 @@ class CrossAttention(nn.Module):
        q, k, v = map(lambda t: rearrange(t, 'b n (h d) -> (b h) n d', h=h), (q, k, v))
-        sim = einsum('b i d, b j d -> b i j', q, k) * self.scale
+        # force cast to fp32 to avoid overflowing
        if _ATTN_PRECISION =="fp32":
            with torch.autocast(enabled=False, device_type = 'cuda'):
                q, k = q.float(), k.float()
                sim = einsum('b i d, b j d -> b i j', q, k) * self.scale
        else:
            sim = einsum('b i d, b j d -> b i j', q, k) * self.scale
        del q, k
-
+    
        if exists(mask):
            mask = rearrange(mask, 'b ... -> b (...)')
            max_neg_value = -torch.finfo(sim.dtype).max